(19) 



J 



(12) 



Europaisches Patentamt 
European Patent Office 
Off ice europeen des brevets (11) EP 1 043 399 A2 

EUROPAISCHE PATENTANMELDUNG 



(43) Veroffentlichungstag: 

11.10.2000 Patentblatt 2000/41 

(21) Anmeldenummer: 00105929.4 

(22) Anmeldetag: 23.03.2000 



(51) IntCI. 7 : C12N 15/86, C12N 7/01, 
C12N7/04, C12N5/10, 
C07K 14/18, A61K 49/00, 
A61 K 48/00 



(84) Benannte Vertragsstaaten: 


(72) Erfinder: 


AT BE CH CY DE DK ES Fl FR GB GR IE IT LI LU 


Bartenschlager, Ralf, Dr. 


MCNL PTSE 


55239 Gau-Odernheim (DE) 


Benannte Erstreckungsstaaten: 


(74) Vertreter: Rudolph, Ulrike, Dr. 


AL LT LV MK RO SI 




Patentanwaltin 


(30) Prioritat: 03.04.1999 DE 19915178 


In der SchanzIO 




69198 Schriesheim (DE) 


(71) Anmelder: 


Bartenschlager, Ralf, Dr. 




55239 Gau-Odernheim (DE) 





(54) Hepatitis C Virus Zellkultursystem 

(57) Das erfindungsgemaBe Hepatitis C Virus 
(HCV) Zellkultursystem besteht aus humanen Hepato- 
mazellen, die mit einem HCV-RNA-Konstrukt transfi- 
ziert sind, das die HCV-spezifischen RNA-Abschnitte 5' 
NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR und 
zudem wenigstens ein selektierbares Markergen 
(Selektionsgen) urrrfaRt. 



CM 
< 

o> 

CO 
CO 



Q. 
LU 



Printed by Xerox (UK) Business Services 
2.16.7 (HRS)/3.6 



EP 1 043 399 A2 



Beschreibung 

[0001] Die Erfindung betrifft ein Hepatitis C Virus (HCV) Zellkultursystem, das im wesentlichen eukaryontische Zel- 
len umfaBt, die eingeschleustes HCV-spezifisches Genmaterial enthalten, d.h. die mit HCV-spezrfischem Genmaterial 
5 transfiziert sind. 

[0002] Das Hepatitis C Virus (HCV) ist eine der Hauptursachen chronischer und sporadischer Leberkrankungen 
weltweit. Die meisten HCV-lnfektionen verlaufen ohne erkennbare klinische Symptome, allerdings werden 80-90% der 
Infizierten dauerhafte Virustrager und bei 50% dieser dauerhaften Virustrager kommt es zu einer chronischen Leber- 
entzundung mit unterschiedlichen Schweregraden. Ca. 20% der chronisch Infizierten entwickeln im Laufe von 10 bis 20 

10 Jahren eine Leberzirrhose, auf deren Basis sich ein primares Leberzellkarzinom entwickeln kann. Die chronische 
Hepatitis C ist heute die Hauptindikation fur eine Lebertransplantation. Eine Kausaltherapie gibt es bisher noch nicht. 
Die einzige derzeit verfugbare Therapie ist die hochdosierte Verabreichung von Interferon-Alpha Oder eine Kombination 
aus Interferon-Alpha und dem Purin-NuWeosidanalogon Ribavirin. Allerdings sprechen nur ca. 60 % aller Behandelten 
auf diese Therapie an und bei diesen kommt es in mehr als der Halfte aller Falle nach dem Absetzen der Behandlung 

15 zu einer erneuten Viramie. 

Aufgrund der hohen Pravalenz, gerade auch in den Industrielandern, den schwerwiegenden Folgen chronischer Infek- 
tionen und dem Fehlen einer Kausaltherapie ist die Entwicklung einer HCV-spezifischen Chemotherapie ein wesentli- 
ches Ziel der pharmazeutischen Forschung und Entwicklung. Hauptproblem hierbei ist bisher das Fehlen eines 
geeigneten Zellkultursystems, das ein Studium der Virus- Replikation und der Pathogenese in eukaryontischen Zellen 

20 ermoglicht. 

[0003] Aufgrund der geringen Virusmengen im Blut bzw. Gewebe, dem Fehlen geeigneter Zellkultursysteme oder 
Tiermodelle (bis heute ist der Schimpanse das einzige mdgliche Versuchstier) sowie dem Fehlen effizienter Systeme 
zur Produktion virus-ahnlicher Partikel, konnte die molekulare Zusammensetzung des HCV-Partikels bis heute noch 
nicht eingehend untersucht bzw. aufgeklart werden. Die derzeit vorliegenden Ergebnisse lassen sich wie folgt zusam- 

25 menfassen: Das HCV ist ein umhulltes Plusstrang RNA Virus mit einem Partikeldurchmesser von 50-60 nm und einer 
mittleren Dichte von 1,03-1,1g/ml. Es wurde erstmals 1989 molekular Woniert und charakterisiert (Choo et al., 1989: 
Science, 244, 359-362). Die HCV- RNA hat eine Lange von ca. 9.6 kb (= 9600 Nukleotide), eine positive Polaritat und 
besitzt ein einziges offenes Leseraster (ORF = open reading frame), das ein lineares Polyprotein von ca 3010 Amino- 
sauren kodiert (siehe Rice 1996, in Virology, B. N. Fields, D. M. Knipe, P. M. Howley, Eds. (Lippincott-Raven, Philadel- 

30 phia, PA, 1996), vol. 1, pp.931 -960; Clarke 1997, J. Gen. Virol. 78, 2397; und Bartenschlager 1997, Intervirology 40, 
378 und vgl. Fig. 1 A). Bei der Virusreplikation wird das Polyprotein durch zellulare und virale Proteasen in die reifen 
und funktionell aktiven Proteine gespalten. 

Innerhalb des Polyproteins sind die Proteine wie folgt angeordnet (vom Amino- zum Carboxyterminus): Core-E1-E2-p7- 
NS2-NS3-NS4A-NS4B-NS5A-NS5B. Das Core-Protein ist die Hauptkomponente des Nukleokapsids. Die Glykoprote- 

35 ine E1 und E2 sind Transmembranproteine und Hauptkomponenten der Virushiille. Sie spielen wahrscheinlich bei der 
Anheftung des Virus an die Wirtszelle eine wesentliche Rolle. Diese drei Proteine Core, E1 und E2 bauen den Virus- 
partikel auf und werden deshalb als Struklurproteine bezeichnet. Die Funktion des Proteins p7 ist noch unklar. Das Pro- 
tein NS2 ist wahrscheinlich die katalytische Domane der NS2-3 Protease, die fur die Prozesierung zwischen den 
Proteinen NS2 und NS3 verantwortlich ist. Das Protein NS3 hat zwei Funktionen, namlich in der aminoterminalen 

40 Domane eine Proteaseaktivitat, die fur die Polyproteinprozessierung essentiell ist, und in der carboxyterminalen 
Domane eine NTPase/Helikase-Funktion, die wahrscheinlich bei der Replikation der viralen RNA eine Rolle spielt. Das 
Protein NS4A ist ein Kofaktor der NS3-Protease. Die Funktion des Proteins NS4B ist unbekannt. 
[0004] Das offene Leseraster ist an seinem 5' Ende von einer ca 340 Nukleotide langen nicht-translatierten Region 
(NTR = non -translated region) flankiert, die als interne Ribosomenansatzstelle (IRES = internal ribosome entry site) 

45 fungiert, und an seinem 3' Ende von einer ca. 230 Nukleotide langen NTR, die hochstwahrscheinlich fur die Genomre- 
plikation von Bedeutung ist. Eine solche 3' NTR ist Gegenstand der Patentanmeldung PCT/US 96/14033. Die Struktur- 
proteine in dem amino-terminalen Viertel des Polyproteins werden von der Signalpeptidase der Wirtszelle gespalten. 
Die Nicht-Strukturproteine (NS) 2 bis (NS) 5B werden von zwei viralen Enzymen prozessiert, namlich von der NS2-3 
und der NS3/4A Proteinase. Die NS3/4A Proteinase wird fur alle Spaltungen jenseits des Carboxyterminus von NS3 

50 benotigt. Die Rolle von NS4B ist nicht bekannt. NS5A, ein hoch phosphoryliertes Protein, scheint fur die Interferon 
Resistenz verschiedener HCV-Genotypen verantwortlich zu sein (vgl. Enomoto et al. 1995, J. Clin. Invest. 96, 224; 
Enomoto et al. 1996, N. Engi. J. Med. 334, 77; Gale Jr. et al. 1997, Virology 230, 217; Kaneko et al. 1994, Biochem. 
Biophys. Res. Commun. 205, 320; Reed etal., 1997, J. Virol. 71, 7187) und NS5B wurde als die RNA-abhangige RNA 
Polymerase identifiziert. 

55 [0005] Anhand dieser Erkenntnisse wurden erste Diagnosesysteme entwickelt, die entweder auf dem Nachweis 
von HCV-spezifischen Antikorpern in Patientenserum oder auf dem Nachweis von HCV-spezifischer RNA mittels RT- 
PCR (= Reverse Transcription Polymerase Chain Reaction) beruhen, und die mittlerweile routine- und/oder vorschrifts- 
maBig bei alien Blutkonserven angewendet werden (mussen). 
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[0006] Seit der Erstbeschreibung des Genoms 1989 wurden mit Hilfe der PCR-Methode zahlreiche Teil- und Kom- 
plettsequenzen des HCV kloniert und charakterisiert. Ein Vergleich dieser Sequenzen zeigt eine hohe Variability des 
viralen Genoms, insbesondere im Bereich des NS5B-Gens, was letztendlich zu einer Einteilung in 6 Genotypen gefuhrt 
hat, die selbst nochmals in Subtypen a, b, und c untergliedert sind. Die genomische Varianz ist nicht gleichmaBig uber 
5 das Genom verteilt. So sind die 5'NTR und Teile der 3'NTR hoch konserviert, wahrend bestimmte kodierende Sequen- 
zen z.T. sehr stark variieren, vor all em die Hullproteine E1 und E2. 

[0007] Die Wonierten und charakterisierten Teil- und Komplettsequenzen des HCV-Genoms wurden auBerdem hin- 
sichtlich geeigneter Angriffsziele fur ein prospektives antivirales Therapeutikum untersucht. Dabei wurden drei virale 
Enzyme gefunden, die sich als solches Angriffsziel anbieten. Diese sind (1) der NS3/4A Proteasekomplex, (2) die NS3 

10 Helikase und (3) die NS5B RNA-abhangige RNA Polymerase. Der NS3/4A Proteasekomplex und die NS3 Helikase 
konnten bereits kristallisiert und hinsichtlich ihrer dreidimensionalen Struktur aufgeklart werden (Kim et al., 1 996, Cell, 
87,343; Yem et al., 1998, Protein Science, 7, 837; Love et al., 1996, Cell, 87, 31 1 ; Kim et al., 1998, Structure, 6, 89; Yao 
et al., 1997, Nature Structural Biology, 4, 463, Cho et al.„ 1998, J. Biol. Chem., 273, 15045); bei der NS5B RNA-abhan- 
gigen RNA Polymerase ist dies bis heute noch nicht gelungen. 

is Obwohl mit diesen Enzymen bedeutsame Angriffsziele fur eine Therapieentwicklung der chronischen HCV-lnfektion 
definiert sind, und obwohl sowohl mit Hilfe von 'rational drug design' als auch mit Hilfe von 'high throughput screens' 
weltweit intensiv nach geeigneten Inhibitoren gesucht wird, leidet die Therapieentwicklung an einem groBen Defizit, 
namlich dem Fehlen von Zellkultursystemen oder einfachen Tiermodellen, die es erlauben, HCV-RNA oder HCV-Anti- 
gene direkt, zuverlassig und mit einfachen laboriiblichen Methoden nachzuweisen. Das Fehlen solcher Zellkultursy- 

20 steme ist auch der Hauptgrund dafur, daB das Verstandnis der HCV-Replikation bis heute noch sehr luckenhaft und in 
weiten Teil en nur hypothetisch ist. 

[0008] Obwohl nach Meinung der Fachwelt eine enge evolutionare Beziehung zwischen HCV und den Flavi- und 
Pestiviren besteht und fur diese autonom replizierende RNAs beschrieben sind, die in verschiedenen Zellinien ohne 
weiteres zur Replikation gebracht werden konnen und dabei relativ hohe Ausbeuten zeigen ( siehe Khromykh et al., 
25 1997, J. Virol. 71, 1497; Behrens et al., 1998, J.Virol. 72, 2364; Moser et al., 1998, J. Virol 72, 5318), waren ahnliche 
Versuche mit HCV bisher nicht erfolgreich. 

[0009] Zwar ist aus verschiedenen Publikationen bekannt, daB Zellinien oder primare Zellkulturen mit HCV-halti- 
gem, hochtitrigem Patientenserum infiziert werden konnen, (Lanford etal. 1994, Virology 202, 606; Shimizu etal. 1993, 
Procedings of the National Academy of Sciences, USA, 90, 6037-6041; Mizutani et al. 1996, Journal of Virology, 70, 

30 721 9-7223; M. Ikeda et al. 1 998, Virus Res. 56, 157; Fournier et al. 1 998, J. Gen. Virol. 79, 2376 und darin zitierte Lite- 
raturstellen, Ito et al. 1996, Journal of General Virology, 77, 1043-1054), diese virusinfizierten Zellinien oder Zellkultu- 
ren erlauben jedoch nicht den direkten Nachweis von HCV-RNA oder HCV-Antigenen. Die virale RNA in diesen Zellen 
ist weder in einem Nothern-Blot (einem Standardverfahren zum quantitativen Nachweis von RNA) noch sind die viralen 
Protein in einem Western-Blot oder mittels Immunprazipitation detektierbar. Nur mit sehr aufwendigen und indirekten 

35 Methoden ist es iiberhaupt gelungen, eine HCV-Replikation nachzuweisen. Diese nachteiligen Umstande zeigen klar, 
daB die Replikation in diesen bekannten virusinfizierten Zellinien oder Zellkulturen absolut unzureichend ist. 
[001 0] Desweiteren ist aus den Publikationen von Yoo et al. (1995, Journal of Virology, 69, 32-38) und von Dash et 
al., (1997, American Journal of Pathology, 151, 363-373) bekannt, daB Hepatomazellinien mit synthetischer HCV-RNA, 
die mittels in vitro Trankription von kloniertem HCV-Genom gewonnen wurde, transfiziert werden konnen. In beiden 

40 Publikationen gingen die Autoren von dem Grundgedanken aus, daB das virale HCV-Genom eine Plusstrang-RNA ist, 
die nach dem Einschleusen in die Zelle direkt als mRNA fungiert, an die sich Ribosomen anheften und im Zuge von 
Translationsprozessen Virusproteine bilden, aus denen sich letztendlich neue HCV-Partikel bilden (konnen). Diese 
Virusreplikation, d.h. diese neu gebildeten HCV-Viren bzw. deren RNA wurde mittels RT-PCR nachgewiesen. Die publi- 
zierten Ergebnisse der durchgefuhrten RT-PCR sprechen jedoch dafur, daB die Effizienz der HCV-Replikation in den 

45 beschriebenen HCV-transfizierten Hepatomazellen nur sehr gering ist und jedenfalls nicht ausreicht, urn Schwankun- 
gen in der Replikationsrate nach gezielter Einwirkung mit prospektiven antiviralen Therapeutika auch nur qualitativ, 
geschweige denn quantitativ zu messen. AuBerdem ist im Stand der Technik mittlerweile bekannt (Yanagi et al., Proc. 
Natl. Acad. Sci. USA, 96, 2291-95, 1999), daB die hochkonservierte 3' NTR essentiell ist fur die Virusreplikation, was 
in klarem Widerspruch zu den Behauptungen von Yoo et al. und Dash et al. steht, die fur ihre Versuche in Unkenntnis 

50 des authentischen 3' Endes des HCV-Genoms ausschlieBlich HCV-Genome mit verkurzten 3' NTRs verwendet haben. 
[0011] Aufgabe der vorliegenden Erfindung ist die Bereitstellung eines HCV- Zellkultursystems, bei dem die virale 
RNA in den transf izierten Zellen autonom und mit so hoher Effizienz repliziert, daB Schwankungen in der Replikations- 
rate nach gezielter Einwirkung mit virus- und insbesondere HCV-spezifischen prospektiven antiviralen Therapeutika 
qualitativ und quantitativ und mit Hilfe gangiger, laborublicher MeBverfahren gemessen werden konnen. 

55 [0012] Eine Losung dieser Aufgabe besteht in der Bereitstellung eines Zellkultursystems der eingangs genannten 
Art, bei dem die eukaryontischen Zellen humane Zellen, insbesondere Hepatomazellen sind, die vorzugsweise von 
einer handelsublichen Hepatomazellinie abstammen, aber auch aus einer entsprechenden Primarzellkultur gewonnen 
sein konnen, und bei dem das eingeschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt ist, das im 
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wesentlichen die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR, vorzugs- 
weise in der genannten Reihenfolge, und zudem wenigstens ein selektierbares Markergen (Seleklionsgen) umfaBt. 
"NTR" steht hier und im folgenden fur "nicht-translatierte Region" und ist dem einschlagigen Fachmann als Begriff bzw. 
Abkurzung bekannt und geiaufig. Der Begriff "HCV-RNA-Konstrukt" umfaBt hier und im folgenden sowohl Konstrukte, 
5 die das komplette HCV-Genom enthalten, als auch solche, die lediglich einen Teil davon, d.h. ein HCV-Subgenom ent- 
halten. 

Eine bevorzugte Variante des erfindungsgemaBen Zellkultursystems, die sich in der Praxis sehr gut bewahrt hat, ist 
unter der Nummer DSM ACC2394 (Laborbezeichnung HuBI 9-13) bei der DSMZ, Deutsche Sammlung von Mikroorga- 
nismen und Zellkulturen GmbH in Braunschweig, Deutschland, hinterlegt. 

10 [001 3] Mit dem erfindungsgemaBen Zellkultursystem wird erstmals ein in-vitro-System bereit gestellt, in dem HCV- 
RNA intrazellular, autonom und in ausreichend groBen Mengen repliziert und exprimiert wird, so daB eine quantitative 
Bestimmung sowohl der HCV-RNA-Mengen als auch der HCV-spezifischen Proteine mit konventionellen und zuverlas- 
sig genauen biochemischen MeBmethoden durchgefuhrt werden kann. Das heiBt: es steht erstmals ein annahernd 
authentisches zellgestutztes ("cell-based") HCV-Replikationssystem zur Verfugung, das fur die Entwicklung und Erpro- 

15 bung von antiviralen Pharmazeutika dringend benotigt wird. Dieses Testsystem bietet nun die Moglichkeit, potentielle 
Angriffsziele fur eine wirksame HCV-spezif ische Therapie zu identif izieren und HCV-spezif ische Chemotherapeutika zu 
entwickeln und zu evaluieren. 

[0014] Die Erfindung basiert auf der Ciberraschenden Erkenntnis, daB eine effiziente Replikation der HCV-RNA nur 
dann in Zellen stattfindet, wenn diese mit einem HCV-RNA-Konstrukt transfiziert wurden, das mindestens die 5' und die 

20 3' nicht-translatierten Regionen (NTR) und die Nichtstrukturproteine (NS) 3 bis 5B umfaBt und zusatzlich ein selektier- 
bares Markergen (Selektionsgen) aufweist. Offensichtlich sind die Strukturgene fur den Ablauf der Replikation ohne 
wesentliche Bedeutung, wahrend andererseits eine effiziente Replikation der HCV-RNA anscheinend nur dann stattfin- 
det, wenn die transfizierten Zellen einem permanenten Selektionsdruck unterzogen werden, der durch das mit der 
HCV-RNA verbundene selektierbare Markergen (Selektionsgen) vermittelt wird. Das Markergen (Selektionsgen) 

25 scheint somit einerseits die Selektion derjenigen Zellen zu provozieren, in denen die HCV-RNA produktiv repliziert, und 
andererseits scheint es die Effizienz der RNA-Replikation wesentlich zu steigern. 

[0015] Gegenstand der Erfindung ist auch ein zellfreies HCV-RNA-Konstrukt, das sich dadurch auszeichnet, daB 
es die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR, vorzugsweise in der 
genannten Reihenfolge, und zudem ein selektierbares Markergen (Selektionsgen) umfaBt. 
30 [0016] Der Begriff 5' NTR bzw. NS3 bzw. NS4A bzw. NS4B bzw. NS5A bzw. NS5B bzw. 3' NTR umfaBt im vorlie- 
genden Zusammenhang jede Nukleotidsequenz, die im Stand der Technik als Nukleotidsequenz fur den jeweils betref- 
fenden funktionellen Abschnitt des HCV-Genoms beschrieben ist. 

[0017] Die Bereitstellung eines solchen HCV-RNA-Konstrukls ermoglicht erstmals eine detaillierte Analyse der 
HCV - Replikation, - Pathogenesis und - Evolution in Zellkulturen. Die HCV-spezif ische virale RNA kann - als vollstan- 
35 diges Genom oder als Subgenom - gezielt in beliebigen Mengen erzeugt werden, und es besteht die Moglichkeit, das 
RNA-Konstrukt zu manipulieren und damit die HCV-Funktionen auf genetischer Ebene zu untersuchen und aufzukla- 
ren. 

[0018] Da alle zur Zeit als Hauptangriffsziel fur eine Therapie untersuchten HCV-Enzyme, namlich die NS3/4A Pro- 
tease, die NS3 Helikase und die NS5B Polymerase, in dem erfindungsgemaBen HCV-RNA-Konstrukt enthalten sind, 

40 kann es fur alle entsprechenden Untersuchungen benutzt werden. 

[0019] Eine Ausfuhrungsform des HCV-RNA-Konstrukts, die sich in der praktischen Anwendung sehr gut bewahrt 
hat, zeichnet sich dadurch aus, daB sie die Nukleotidsequenz gemaB Sequenzprotokoll SEQ ID NO:1 umfaBt. 
Weitere Ausfuhrungsvarianten mit vergleichbar guten Eigenschaften fur den Einsatz in der Praxis sind dadurch 
gekennzeichnet, daB sie eine Nukleotidsequenz entweder gemaB Sequenzprotokoll SEQ ID NO:2 oder SEQ ID NO:3 

45 oder SEQ ID NO:4 oder SEQ ID NO:5 oder SEQ ID NO:6 oder SEQ ID NO:7 oder SEQ ID NO:8 oder SEQ ID NO:9 
oder SEQ ID NO:10 oder SEQ ID NO:11 umfassen. 

[0020] Es besteht die Moglichkeit, das erfindungsgemaBe HCV-Subgenom-Konstrukt mit einer 3' NTR zu verse- 
hen, die eine im Stand der Technik hierfur bisher unbekannte Nukleotidsequenz aufweist, namlich eine Nukleotidse- 
quenz, die aus der Gruppe der nachfolgend aufgelisteten Nukleotidsequenzen (a) bis (i) ausgewahlt ist: 

50 



55 
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(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTTTTTA 
GCTTTTTTTTTTTTCTTTTTTTTTGAGAGAGAGAGTCTCACTCTGTTGCCC 
AGACTGGAGT 

(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 



(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 

30 TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA GAGTCTCACT 

CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
35 TTTTTAGTCT TTTTT TTTTT CTTTTTTTTT GAGAGAGAGA 

GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
40 TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 

GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
45 TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 

AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 



Das in den erfindungsgemaGen HCV-RNA-Konstrukten enthallene selektierbare Markergen (Selektionsgen) ist vor- 

so zugsweise ein Resistenzgen, insbesondere eine Arrtibiotikumresistenzgen. 

Das hat den Vorteil, daft die mit diesem Konstrukt transf izierten Zellen leicht von den nicht transfizierten Zellen selek- 
tiert werden konnen, indem dem Zellkulturmedium z.B. im Fall eines Antibiotikumresistenzgens das betreffende Anti- 
biotikum zugegeben wird. Unter Antibiotikum' wird im vorliegenden Zusammenhang jede Substanz verstanden, die die 
nicht-transfizierten Wirtszellen oder die Zellen, in denen die HCV-RNA nur mit geringer Effizienz repliziert, am Leben 

55 oder Wachstum hindert, insbesondere Zellgifte wie z.B. Puromycin, Hygromycin, Zeocin, Bleomycin oder Blasticidin. 
[0021] Ein bevorzugtes selektierbares Markergen (Selektionsgen) bzw. Resistenzgen, das sich in der Praxis sehr 
gut bewahrt hat, ist das Neomycinphosphotransferasegen. 

[0022] Eine Alternative zu den Antibiotikumresistenzgenen ist z.B. das Thymidin-Kinase-Gen, mit dem eine HAT- 
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Selektion durchgefuhrt werden kann. 

[0023] Die Position des selektierbaren Markergens (Selektionsgens), bzw. des bevorzugten Resistenzgens bzw. 
des besonders bevorzugten Antibiotikumresistenzgens in dem HCV-RNA-Konstrukt liegt vorzugsweise hinter der HCV 
5' NTR, d.h. strangabwarts der 5' NTR bzw. strangaufwarts des HCV-Leserasters. Denkbar ist aber auch eine Insertion 

5 im Bereich der 3' NTR Oder an anderer Stelle des HCV-Genoms Oder -Subgenoms, z.B. innerhalb des Polyproteins. 
[0024] Bei einer alternativen Ausfiihrungsform des erfindungsgemaBen HCV-RNA-Konstrukls ist das selektierbare 
Markergen (Selektionsgen), insbesondere ein Antibiotikumresistenzgen, uber ein Ribozym bzw. eine Erkennungsstelle 
fur ein Ribozym mit der HCV-RNA bzw. der HCV-Genom- oder -Subgenomsequenz verbunden. 
[0025] Damit geht der Vorteil einher, daB nach erfolgter Selektion derjenigen Zellen, in denen die HCV-RNA pro- 

10 duktiv repliziert, in den daraus gewonnenen Zellklonen das Resistenzgen durch ribozymvermittelte Spaltung von der 
HCV-Subgenomsequenz abgetrennt werden kann, namlich durch Aktivierung des einklonierten Ribozyms oder, im Fall 
eines Konstrukts mit einer Erkennungsstelle fur ein Ribozym, durch Einschleusen des Ribozyms in die Zellen (z.B. mit- 
tels Transfektion eines Ribozymkonstrukts oder Infektion mit einem viralen Expressionsvektor, in den das entspre- 
chende Ribozym eingesetzt wurde). Auf diese Weise wird ein authentisches HCV-Genom- Konstrukt ohne 

15 Resistenzgen erhalten, das zur Bildung authentischer infektioser Viruspartikel befahigt ist. 

[0026] Eine weitere bevorzugte Ausfiihrungsform des erfindungsgemaBen HCV-RNA-Konstrukts zeichnet sich 
dadurch aus, daB das Konstrukt wenigstens ein integriertes Reportergen aufweist. 

[0027] Unter Reportergen wird im folgenden jedes Gen verstanden, dessen Anwesenheit sich nach Uberfuhrung 
in einen Zielorganismus leicht und im allgemeinen mit einfachen biochemischen oder auch histochemischen Methoden 
20 nachweisen laBt, d.h. das fur ein Protein kodiert, welches auch in geringen Mengen einfach und zuverlassig mit den 
laborublichen MeBmethoden nachgewiesen und quantifiziert werden kann. 

[0028] Diese Variante des HCV-RNA-Konstrukts hat den Vorteil, daB der Umfang der Replikation dieses Konstrukts 

anhand des Reportergenprodukts einfach und schnell mit laborublichen Methoden gemessen werden kann. 

[0029] Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloram- 

25 phenicol-Acetyl-Transferase-Gen), dem lacZ-Gen (beta-Gal aktosidaseg en), dem GFP-Gen (green-fluorescence-pro- 
tein-Gen ), dem GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (Sezernerte-Alkalische-Phosphatase-Gen). 
Diese Reportergene bzw. deren Produkte, namlich die entsprechenden Reporterproteine, konnen z.B. mittels Fluores- 
zenz, Chemilumineszenz, colorimetrisch oder mit Hilfe immunologischer Methoden (z.B. ELISA) bestimmt werden. 
[0030] Als Reportergen kommt aber auch ein Surrogatmarkergen in Betracht. Darunter sind in diesem Zusammen- 

30 hang solche Gene zu verstehen, die fur zellulare Proteine, NuWeinsauren oder — allgemein — fur solche Funktionen 
kodieren, die einer von der Virusreplikation abhangigen Variation unterliegen, und die infolgedessen in denjenigen Zel- 
len, in denen sich das HCV bzw. das HCV-RNA-Konstrukt vermehrt, entweder reprimiert oder aktiviert werden. Das 
heiBt: die Reduktion bzw. Aktivierung dieser Funktion ist ein Ersatzmarker fur die Virusreplikation bzw. die Replikation 
des HCV-RNA-Konstrukts. 

35 [0031] Die Positionen von Reportergen und selektierbarem Markergen (Selektionsgen) konnen so gewahlt sein, 
daB ein aus den beiden Genprodukten gebildetes Fusionsprotein exprimiert wird. Hierbei besteht die vorteilhafte Mog- 
lichkeit, daB diese beiden Gene so in dem HCV-RNA-Konstrukt angeordnet sind, daB ihre beiden exprimierten Proteine 
zunachst uber eine Schnittstelle fur eine Protease (z.B. Ubiquitin) oder uber ein selbstspaltendes Peptid (z.B. das 2A- 
Protein der Picornaviren) fusioniert sind und erst spater proteolytisch wieder getrennt werden. 

40 Ebensogut konnen diese beiden Positionen aber auch derart getrennt voneinander liegen, daB beide Genprodukte 
separat exprimiert werden. (z.B. in der Reihenfolge: Marker- bzw. Resistenzgen — interne Ribosomenbindungsstelle 
— Reportergen). 

Im Fall des Reportergens hat sich eine Ausfuhrungsvariante besonders bewahrt, bei der das Reportergen in das offene 
Leseraster des HCV-Genoms oder -Subgenoms einkloniert ist, und zwar derart, daB es erst nach einer proteolytisch en 
45 Prozessierung in eine aktive Form uberfuhrt wird. 

[0032] Das erfindungsgemaBe Zellkultursystem in alien seinen Variationen kann fur vielfaltige Zwecke eingesetzt 
werden. Diese umfassen: 

Das Auffinden antiviral wirksamer Substanzen. Dies konnen beispielsweise sein: organische Verbindungen, die 
so unmittelbar oder mittelbar in die Virusvermehrung eingreifen (z.B. Inhibitoren der viralen Proteasen, der NS3-Heli- 
kase, der NS5B RNA-abhangigen RNA Polymerase), antisense Oligonukleotide, die an eine beliebige Zielsequenz 
innerhalb des HCV-RNA-Konstrukts (z.B. die 5' NTR) hybridisieren und unmittelbar oder mittelbar zu einer Beein- 
flussung der Virusvermehrung fiihren z.B. auf Grund einer Reduktion der Translation des HCV- Polyproteins oder 
Ribozyme, die eine beliebige HCV-RNA-Sequenz spalten und damit die Virusreplikation beeintrachtigen. 
55 • Die Evaluierung jeglicher Art antiviral wirksamer Substanzen in Zellkultur. Solche Substanzen konnen beispiels- 
weise mittels 'rational drug design' oder 'high-throughput screening' am isolierten gereinigten Enzym gefunden 
werden. Unter Evaluierung sind vor allem die Bestimmung der inhibitorischen Eigenschaften der entsprechenden 
Substanz sowie deren Wirkungsmechanismus zu verstehen. 
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Die Identifikation neuer Angriffsziele, viralen oder zellularen Ursprungs, fur eine HCV-spezifische antivirale Thera- 
pie. 1st beispielsweise ein zellulares Protein essentiell fur die Virusreplikation, kann mittels Hemmung dieses zellu- 
laren Proteins die Virusreplikation ebenfalls beeinfluBt werden. Das Auffinden solcher auxiliaren Faktoren ist mit 
dem erfindungsgemaBen System ebenfalls moglich. 

s • Der Einsatz fur die Resistenzbestimmung. Es ist anzunehmen, daB auf Grund der hohen Mutationsrate des HCV- 
Genoms Therapieresistenzen auftreten. Solche Resistenzen, die gerade bei der Winischen Zulassung einer Sub- 
stanz von groBer Bedeutung sind, lassen sich mit dem erfindungsgemaBen Zellkultursystem ermitteln. Zellinien in 
denen sich das HCV-RNA-Konstrukt bzw. das HCV-Genom oder - Subgenom repliziert, werden mit steigenden 
Konzentrationen der entsprechenden Substanz inkubiert und die Replikation der viralen RNA wird entweder 

10 anhand eines eingebrachten Reporters oder durch qualitative oder quantitative Bestimmung der viralen NuWein- 
sauren oder Proteine bestimmt. Resistenz ist dann gegeben, wenn bei normaler Wirkstoffkonzentration keine 
Hemmung der Replikation zu beobachten ist. Durch Reklonierung der HCV-RNA (z.B. mittels RT-PCR) und 
Sequenzanalyse konnen die fur Therapieresistenz verantwortlichen Nukleotid- bzw. Aminosaureaustausche ermit- 
telt werden. Durch Einklonieren der/des entsprechenden Austausche/s in das Ursprungskonstrukt kann deren 

is Kausalitat fur die Therapieresistenz bewiesen werden. 

Die Produktion von authentischen Virusproteinen (Antigene) fur die Entwicklung und/oder Evaluierung von Diagno- 
stika. Das erfindungsgemaBe Zellkultursystem erlaubt auch die Expression von HCV-Antigenen in Zellkulturen. 
Diese Antigene konnen prinzipiell auch fur den Aufbau diagnostischer Nachweisverfahren eingesetzt werden. 
Die Produktion von HCV Viren und virus-ahnlichen Partikeln insbesondere zur Entwicklung oder Herstellung von 

20 Therapeutika und Impfstoffen sowie fur diagnostische Zwecke. Insbesondere zellkultur-adaptierte vollstandige 
HCV-Genome, die mit dem erfindungsgemaBen Zellkultursystem hergestellt werden konnen, sind in der Lage, mit 
hoher Effizienz in Zellkulturen zu replizieren. Diese Genome besitzen alle Funktionen des HCV und sind deshalb 
in der Lage infektiose Viren zu produzieren. 

25 [0033] Das erfindungsgemaBe HCV-RNA-Konstrukt fur sich genommen kann in alien seinen Variationen ebenfalls 
fur vielfaltige Zwecke eingesetzt werden. Dazu gehoren vor allem: 

Die Konstruktion attenuierter Hepatitis C Viren bzw. HCV-ahnlicher Partikel und deren Produktion in Zellkulturen: 
Durch zufallige oder gezielt hervorgerufene Mutationen, beispielsweise Punktmutationen, Deletionen oder Insertio- 
30 nen, konnen attenuierte HCV- oder HCV-ahnliche Partikel erzeugt werden, d.h. Viren bzw. virusahnliche Partikel 
mit voller Replikationskompetenz aber verringerter bzw. fehlender Pathogenitat. Solche attenuierte HCV- oder 
HCV-ahnliche Partikel sind insbesondere als Impfstoff einsetzbar. 

Die Konstruktion von HCV-RNA-Konstrukten mit integrierten Fremdgenen, beispielsweise zur Verwendung als 
leberzellspezif ische Genfahren in der Gentherapie. Auf Grund des ausgepragten Leberzelltropismus des HCV und 

35 der Moglichkeit, Teile des Genoms durch heterologe Sequenzen zu ersetzen, lassen sich HCV-RNA-Konstrukte 
herstellen, bei denen beispielsweise die Strukturproteine durch ein therapeutisch wirksames Gen ersetzt werden. 
Das so erhaltene HCV-RNA-Konstrukt wird in Zellen eingeschleust, vorzugsweise mittels Transfektion, die die feh- 
lenden HCV- Funktionen, beispielsweise die Struturproteine, konstitutiv oder induzierbar exprimieren. Durch diese 
dem Fachmann unter dem Begriff der Transkomplementation' bekannte Technik lassen sich Viruspartikel erzeu- 

40 gen, in die das HCV-RNA-Konstrukt eingebaut wird. Die so erhaltenen Partikel konnen fur die Infektion vorzugs- 
weise von Leberzellen verwendet werden. In diesen wird das therapeutisch wirksame Fremdgen zur Expression 
gebracht und entfaltet damit seine therapeutische Wirkung. 

Das Auffinden permissiver Zellen, d.h. Zellen, in denen eine produktive Virusvermehrung erfolgt. Zu diesem Zweck 
wird entweder eines der vorgenannten HCV-RNA-Genomkonstrukte verwendet, das zur Bildung kompletter infek- 

45 tioser Viren befahigt ist, oder es wird eines der vorgenannten HCV-Subgenom-Konstrukte eingesetzt, das aller- 
dings zunachst gemaB vorgenanntem Beispiel in eine Zellinie transfiziert wird, die die fehlenden Funktionen 
konstitutiv oder induzierbar exprimiert. In all diesen Fallen entstehen Viruspartikel, die zusatzlich zur HCV- 
Sequenz ein Resistenz- und/oder Reportergen tragen. Zum Auffinden von Zellen, in denen das HCV replizieren 
kann, werden diese Zellen mit den so hergestellten Viren infiziert und einer Antibiotikumselektion unterzogen oder, 

50 in Abhangigkeit vom HCV-RNA-Konstrukt, mittels Nachweis der Expression des Reportergens untersucht. Da eine 
Antibiotikumresistenz bzw. eine Expression des Reportergens nur dann nachweisbar ist, wenn das HCV-RNA-Kon- 
strukt repliziert, mussen die so gefundenen Zellen permissiv sein. Auf diese Weise lassen sich nahezu beliebige 
Zellinien oder primare Zellkulturen hinsichtlich der Permissivitat testen und auffinden. 

55 [0034] Das erfindungsgemaBe Zellkultursystem erlaubt auch das gezielte Auffinden von HCV-RNA-Konstrukten, 
bei denen es auf Grund von Mutationen, die sich entweder zufallig im Rahmen der HCV-RNA-Replikation ereignen 
oder die gezielt in das Konstrukt eingefuhrt werden, zu einer Steigerung der Replikationseffizienz kommt. Solche Muta- 
tionen, die zu einer Veranderung der Replikation des HCV-RNA-Konstrukts fuhren, sind dem Fachmann als adaptive 
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Mutationen bekannt. Die Erfindung umfaBtdeshalb auch Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten 
eines erfindungsgemaBen HCV-RNA-Konstrukts gemaB vorstehender Beschreibung, wobei die Mutanten gegeniiber 
dem originaren HCV-RNA-Konstrukt eine erhohte Replikationseffizienz aufweisen. Sie umfaBt desweiteren ein Verfah- 
ren zur Herstellung von Mutanten eines HCV-RN A- Voliangengenoms Oder eines HCV-RNA-Teilgenoms Oder eines 
5 beliebigen HCV-RNA-Konstrukts mit im Vergleich zu dem ursprunglichen HCV-RNA-Vollangengenom oder -Teilgenom 
Oder HCV-RNA-Konstrukt erhohter Replikationseffizienz, sowie zellkultur-adaptierte Mutanten von HCV-RNA-Kon- 
strukten, HCV-Vollangengenomen und HCV-Teilgenomen mit im Vergleich zu den ursprunglichen Konstrukten, Teil- 
oder Vollangengenomen erhohter Replikationseffizienz. 

[0035] Das erfindungsgemaBe Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten eines erfindungs- 
10 gemaBen HCV-RNA-Konstrukts, wobei die Mutanten gegeniiber dem HCV-RNA-Konstrukt eine erhohte Replikations- 
effizienz aufweisen, ist dadurch gekennzeichnet, daB man ein Zellkultursystem gemaB Anspruch 1, bei dem das 
eingeschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt mit Selektionsgen nach einem der Anspruche 4 
bis 19 ist, auf/in dem dem Selektionsgen entsprechenden Selektionsmedium kultiviert, daB man die gewachsenen Zell- 
klone erntet, und daB man aus diesen ZellWonen die HCV-RNA-Konstrukte isoliert. 
15 [0036] Bei einer vorteilhaften Weiterbildung dieses Herstellungsverfahrens werden die isolierten HCV-RNA-Kon- 
strukte wenigstens einmal erneut passagiert, namlich in Zellen eines Zellkultursystems nach Anspruch 1 einge- 
schleust, das dabei erhaltene Zellkultursystem gemaB Anspruch 1, bei dem das eingeschleuste HCV-spezifische 
Genmaterial das isolierte HCV-RNA-Konstrukt mit Selektionsgen ist, auf/in dem dem Selektionsgen entsprechenden 
Selektionsmedium kultiviert, die gewachsenen Zellklone geerntet und daraus die HCV-RNA-Konstrukte isoliert. 
20 Mit dieser Verfahrensvariante kann der Grad der adaptiven Mutationen und damit der Grad der Replikationseffizienz in 
den betreffenden HCV-RN A- Konstrukten noch gesteigert werden. 

[0037] Das erfindungsgemaBe Verfahren zur Herstellung von Mutanten eines HCV - Voliangengenoms oder eines 
HCV- Teilgenoms oder eines beliebigen HCV-RNA-Konstrukts mit im Vergleich zu dem ursprunglichen HCV- Vollangen- 
genom oder - Teilgenom oder HCV-RNA-Konstrukt erhohter Replikationseffizienz zeichnet sich dadurch aus, daB man 

25 mit Hilfe eines der beiden vorstehend genannten Herstellungsverfahren eine zellkultur-adaptierte Mutante eines HCV- 
RNA-Konstrukts herstellt, diese aus den Zellen isoliert, mit im Stand der Technik bekannten Methoden kloniert und 
sequenziert und durch Vergleich mit der Nukleotid- und Aminosauresequenz des ursprunglichen HCV-RNA-Konstrukts 
die Art, Anzahl und Positionen der Mutationen bestimmt, und diese Mutationen dann entweder durch gezielte Mutage- 
nese oder durch Austausch von Sequenzabschnitten, welche die betreffenden Mutationen enthalten, in ein (isoliertes) 

30 HCV-Vollangen- oder -teilgenom oder ein beliebiges HCV-RNA-Konstrukt einfuhrt. 

Zum Nachweis bzw. zur Verrfizierung derjenigen Mutationen, die tatsachlich eine Veranderung der Replikation und ins- 
besondere eine Replikationssteigerung bewirken, kann ein Test durchgefuhrt werden, bei dem die bestimmten Nukleo- 
tid- und/oder Aminosaureaustausche in das urspriingliche HCV-RNA-Konstrukt eingefuhrt und dieses wiederum in 
Zellkultur eingeschleust wird. Wenn die eingefuhrte Mutation tatsachlich zu einer Steigerung der Replikation fuhrt, 

35 sollte im Fall eines HCV-RNA-Konstrukts mit selektierbarem Markergen die Zahl der resistenten Zellklone bei dem 
kunstlich mutierten Konstrukt deutlich hoher sein als bei dem unbehandelten Konstrukt. Im Fall eines Konstrukts mit 
einem Reportergen sollte die Aktivitat bzw. Menge des Reporters bei dem kunstlich mutierten Konstrukt deutlich hoher 
sein als bei dem unbehandelten. 

[0038] Die erfindungsgemaBen zellkultur-adaptierten HCV-RNA-Konstrukte mit hoher Replikationseffizienz sind 
40 dadurch gekennzeichnet, daB sie durch Nukleotid- und/oder Aminosaureaustausche von einem HCV-RNA-Konstrukt 
nach einem der Anspruche 4 bis 19 ableitbar sind und daB sie mit einem der beiden vorstehend genannten Herstel- 
lungsverfahren erhaltlich sind. 

[0039] Diese zellkultur-adaptierten HCV-RNA-Konstrukte konnen dazu verwendet werden, beliebige HCV-RNA- 
Konstrukte oder HCV-Vollangen- oder Teilgenome mit erhohter Replikationseffizienz herzustellen. Dabei konnen 
45 sowohl Konstrukte mit einem selektierbaren Resistenzgen als auch Konstrukte ohne ein solches bzw. mit einem nicht- 
selektierbaren Reportergen (z.B. Luziferase) hergestellt werden, denn aufgrund der sehr hohen Replikationseffizienz 
des zellkultur-adaptierten HCV-RNA-Konstrukts kann dessen Replikation auch in nicht-selektionierten Zellen nachge- 
wiesen werden. 

Die erfindungsgemaBen zellkultur-adaptierten Mutanten eines HCV-RNA-Konstrukts oder eines HCV-Vollangenge- 
50 noms oder eines HCV-Teilgenoms mit im Vergleich zu dem ursprunglichen HCV-RNA-Konstrukt oder dem ursprungli- 
chen HCV-Vollangengenom erhohter Replikationseffizienz , sind dadurch charakterisiert, daB sie mit einem Verfahren 
erhaltlich sind, bei dem man in einem zellkultur-adaptierten HCV-RN A- Konstrukt durch Sequenzanalyse und Sequenz- 
vergleich die Art und Anzahl der Mutationen bestimmt und diese Mutationen in ein HCV-RNA-Konstrukt, insbesondere 
in ein HCV-RNA-Konstrukt gemaB einem der Anspruche 4 bis 19, oder in ein (isoliertes) HCV-RNA-Vollangengenom 
55 einfuhrt, entweder durch gezielte Mutagenese oder durch Austausch von Sequenzabschnitten, die die betreffenden 
Mutationen enthalten. 

[0040] Eine Gruppe ganz bevorzugter HCV-RNA-Konstrukte, HCV-Vollangengenome und HCV-Teilgenomen mit 
hoher und sehr hoher Replikationseffizienz und infolgedessen sehr guter Eignung fur die praktische Anwendung ist 
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dadurch gekennzeichnet, daB sie einen oder mehrere Oder alle der in Tabelle 3 aufgelisteten Aminosaure- bzw. Nukleo- 
tidaustausche und/oder einen oder mehrere der folgenden Aminosaureaustausche aufweist: 1283 arg -> gly , 1383 glu 
-> ala , 1577 lys -> arg , 1609 lys -> glu , 1936 pro -> ser , 2163 glu -> gly , 2330 lys -> glu , 2442 ile -> val. (Die Zahlen 
beziehen sich auf die Aminosaurepositionen des Polyproteins des HCV-lsolats com , siehe Tabelle 1). 

Besondere Eigenschaften der in den Sequenzprotokollen angegebenen Sequenzen: 

SEQ ID-NO: 1 

[0041] 

Name: l389/Core-37wt 
Aufbau (NuWeotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961: Hullprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

1 1 . 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

15. 10846-1 1076: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 2 

[0042] 

Name: l337/NS2-37wt 
Aufbau (NuWeotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 181 : HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1 190-1800: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 



4. 1801-8403: HCV Polyprotein von Nichtstrukturprotein 2 bis Nichtstrukturprotein 5B 

5. 1801-2451: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

6. 2452-4344: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

7. 4345-4506: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

8. 4507-5289: Nichtstrukturprotein 4B (NS4B) 

9. 5290-6630: Nichtstrukturprotein 5A (NS5A) 

10. 6631-8403: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

1 1. 8407-8637: HCV 3' nicht-translatierte Region 
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SEQ ID-NO: 3 
[0043] 

Name: l389/NS3-3'/wt 
Aufbau (Nukleotidpositionen): 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; seleklionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA- Polymerase 

10. 7771-8001: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 4 

[0044] 

Name: l337/NS3-3'/wt 
Aufbau (Nukleotidpositionen): 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1 181 : HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; seleklionierbarer Marker 

3. 1 190-1800: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1801-7758: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B 

5. 1801-3696: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3697-3858: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3859-4641: Nichtstrukturprotein 4B (NS4B) 

8. 4642-5982: Nichtstrukturprotein 5A (NS5A) 

9. 5983-7755: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA- Polymerase 

10. 7759-7989: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 5 

[0045] 

Name: l389/NS2-3'/wt 
Aufbau (NuWeotidpositionen): 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; seleklionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-8418: HCV Polyprotein von Nichtstrukturprotein 2 bis Nichtstrukturprotein 5B 

5. 1813-2463: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

6. 2464-4356: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

7. 4357-4518: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

8. 4519-5301: Nichtstrukturprotein 4B (NS4B) 

9. 5302-6642: Nichtstrukturprotein 5A (NS5A) 
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10. 6643-8415: Nichtstruktur protein 5B (NS5B); RNA-abhangige RNA-Polymerase 

1 1. 8419-8649: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 6 
[0046] 

Name: I389/NS3-379-13F 
Aufbau (NuWeotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstruklurprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
ten Mutante 9-13F 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 

SEQ ID-NO: 7 

[0047] 

Name: l389/Core-379-13F 
Aufbau (NuWeotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutante 9-13F 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961: Hullprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

1 1. 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 
15. 10846-1 1076: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 8 

[0048] 

Name: I389/NS3 -375.1 
Aufbau (NuWeotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
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3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstruktur protein 5B der zellkultur-adaptier- 
ten Mutante 5. 1 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5B (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA- Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 

SEQ ID-NO: 9 

[0049] 

Name: l389/Core-375. 1 
Aufbau (NuWeotidpositionen): 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; seleklionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutante 5.1 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961: Hullprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

1 1 . 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA- Polymerase 

15. 10846-1 1076: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 10 

[0050] 

Name: I389/NS3-3719 
Aufbau (NuWeotidpositionen): 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
ten Mutante 19 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA- Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 
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SEQ ID-NO: 11 
[0051] 

5 Name: l389/Core-3'/1 9 

Aufbau (Nukleotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

10 3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutante 19 

5. 1813-2385: HCV Core Protein; Strukturprotein 
15 6. 2386-2961 : Hullprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
20 11. 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RN A- Polymerase 

15. 10846-1 1076: HCV 3' nicht-translatierte Region 

25 

[0052] Die Erf indung wird im folgenden anhand von Ausfuhrungsbeispielen und dazugehorigen Tabellen und Figu- 
ren naher erlautert. Die erwahnten Figuren zeigen 

Fig. 1 A: Die Struktur eines erfindungsgemaBen HCV-RNA-Konstrukts Ganz oben ist eine schematische Darstel- 
30 lung der Struktur des kompletten parentalen HCV-Genoms gegeben mit den Positionen der Gene fur die 

Spaltungsprodukte core, E1, E2 ( p7, NS2, NS3, NS4A, NS4B, NS5A und NS5B innerhalb des Polypro- 
teins, und den 5' und 3' nichttranslatierten Regionen (5' NTR und 3' NTR) — als Horizontalbalken darge- 
stellt — , und mit den beiden fur die Erzeugung der Subgenom-Konstrukte ausgewahlten Positionen, 
namlich der Position der 'GDD-katalytischen Domane' der NS5B RNA Polymerase (GDD) und der Posi- 
35 tion der 3' Grenze der HCV-IRES (Nukleotidpositionen 1 bis 377 bzw. 1 bis 389) — oberhalb des Genom- 

schemas eingezeichnet — . Die Zahlen unterhalb des Genomschemas bezeichnen die entsprechenden 
Nukleotidpositionen. 

Darunter sind schematische Darstellungen der Strukturen zweier erfindungsgemaBer, modifizierter 
HCV-RNA-Konstrukte (Subgenom) gezeigt, bestehend aus der 5' HCV-IRES, dem Neomycinphospho- 
40 transferasegen (Neo R ), der EMCV-IRES (E-l) und den HCV Sequenzen von NS2 bzw. NS3 bis zum 

authentischen 3' Ende. Die Position der das NS5B Polymerase GDD-Motiv umfassenden 10 Aminosau- 
ren-Deletion ist jeweils mit einem Dreieck (A) markiert. 

Fig. 1 B: Das Ergebnis einer denaturierenden Formaldehyd-Agarose-Gelelektrophorese zum Nachweis von repli- 
45 zierter Plusstrang-RNA in transfizierten subpassagierten Huh-7 Zellklonen. 

Die Positionen der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angege- 
ben, die GroBen (Anzahlen der Nukleotide) der RNA-Marker (M) sind links von Spur 1 angegeben. 

Fig. 1 C : Das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum Nachweis der Abwesenheit von 
50 integrierter Replikon-DNA in den meisten der selektierten ZellWone. 

Spuren 1 und 2 zeigen die Positivkontrollen, Spur 13 die Negativ-Kontrolle. Die Zahlenangaben links der 
Spur 1 bezeichnen die GroBe der Nukleotid-Marker-Molekule. 

Fig. 2 A: Das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum sensitiven AusschluB integrierter 
55 Replikon-DNA (Plasmid Molekule l 377 /NS3-3ywt) in einem HCV-RNA-Konstrukt-haltigen Zellklon (9-13). 

Die Spuren 7 bis 11 reprasentieren das Ergebnis einer Titration von DNA-Molekulen des Konstrukts 
l 3 77/NS3-3'/wt ohne Zugabe von Gesamt-DNA des Zellklons 9-13 und die Spuren 2 - 6 reprasentieren 
die gleichen Plasmidmolekule mit Zugabe von jeweils 1 ^g 9-13 DNA vor der PCR (zwecks AusschluB 
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eines Inhibitors der PCR in der DN A- Preparation). Spur 13 reprasentiert die Negativ-Kontrolle (PCR 
ohne DNA-Sonde). Spur 1 zeigt das Ergebnis, das mit einem jig Gesamt-DNAdes Zellkons 9-13 erhal- 
ten wurde. 

5 Fig. 2 B: Das Ergebnis eines Northern-Blot-Tests zur Quantifizierung von HCV Plus- und Minusstrang RNA. 

Die Pfeile markieren die Positionen von Replikon-RNA. Die "plus" und "minus" -Abgaben bezeichnen die 
positive (plus) bzw. negative (minus) Polaritat der RNA-Kontrollen, die auf das Gel aufgetragen wurden. 
"Minusstrand" und "Plusstrand" bezeichnen die Spezif itat der radioaktiven RNA-Sonden. 

10 Fig. 2 C: Ergebnis einer Formaldehyd-Agarose-Gelelektrophorese nach radioaktiver Markierung der intrazellular 
replizierten HCV-RNA zum Nachweis der Resistenz der HCV-RNA-Replikation gegen Dactinomycin. 

Fig. 3 A: Nachweis von HCV-spezifischen Antigenen in den selektierten Zellklonen mittels Immunoprazipitation 
nach metabolischer Radioaktivmarkierung. Die Spuren 7 - 9 reprasentieren authentische GroBenmarker 
15 (die nach transienter Expression eines HCV-RNA-Konstrukts in Huh-7-Zellen erhalten wurden); identifi- 

zierte HCV-Proteine sind am linken Rand von Spur 1 markiert, die Molekulargewichte (in Kilodalton) sind 
am rechten Rand von Spur 9 angegeben. 

Fig. 3 B: Ergebnisse eines Immunf luoreszenztests zum Nachweis der subzellularen Lokalisation von HCV Antige- 
20 nen. 

Fig. 4: Schematische Darstellung der Struktur eines erfindungsgemaBen selektierbaren HCV-RNA-Konstrukts 

(komplettes Genom) bestehend aus der 5' HCV- 1 RES, dem Neomycinphosphotransferasegen (NeoR), 
einem heterologen IRES-Element, z.B. des Encephalomyocarditisvirus (E-l), dem vollstandigen HCV- 
25 Leseraster und der authentischen 3' NTR. 

Fig. 5: Schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Antibiotikumresi- 

stenzgen (A) innerhalb der fur das Polyprotein kodierenden Nukleotidsequenz (monocistronische RNA), 
und (B) innerhalb der 3' NTR (bicistronische RNA). 

30 

Fig. 6: Schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Reportergen (A) als 

Teil eines HCV-Replikons von NS3 bis NS5B; — das Reporterprotein wird letztendlich durch virale oder 
durch zellulare Proteasen aus dem Polyprotein gespalten und das selektierbare Markergen (Selektions- 
gen) bzw. das Resistenzgen durch Kontransfektion in die Zellen einschleust , (B) als Teil eines Fusions- 

35 gens aus Resistenz- und Reportergen (z.B. fur die Neomycinphosphotransf erase und green fluorescent 

Protein) (C) als Teil eines Replikons aus Resistenz- und Reportergen (z.B. fur die Neomycinphospho- 
transferase und das green fluorescent Protein), die uber eine Nukleotidsequenz verbunden sind, welche 
fur eine Aminosauresequenz kodiert (schraffierter Bereich), die von einer Protease gespalten werden 
kann oder die uber eine selbstspaltende (autokatalytische) Aktivitat verfiigt, (D) als unabhangiges Gen 

40 (hier green fluorescent protein), das von einer eigenen internen Ribosomenbindungsstelle (IRES) aus 

exprimiert wird; — das Resistenzgen (hier: Neomycinphosphotransferase-Gen) wird davon unabhangig 
ebenfalls von einer eigenen internen Ribosomenbindungsstelle (IRES) aus exprimiert (polycistronisches 
Konstrukt). 

45 Fig. 7: Schematische Darstellung der Struktur eines HCV-RNA-Konstrukts bei dem das Resistenzgen uber ein 

Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. Die dik- 
ken Linien stellen die HCV 5' und 3' NTRs dar, E-l ist eine heterologe interne Ribosomenbindungsstelle, 
die fur die Expression des Resistenzgens notwendig ist, und das graue Quadrat stellt das Ribozym bzw. 
eine Erkennungsstelle fur ein Ribozym dar. 

50 

Fig. 8: Schematische Darstellung der Struktur eines HCV-RNA-Konstrukts mit Resistenzgen und integriertem 
Fremdgen. 

Fig. 9: Methodisches Vorgehen zum Vergleich der spezifischen Infektiositat (ausgedruckt als Anzahl gebildeter 

55 Zellkolonien) von Gesamt-RNA versus in vitro Transkripte. HCV-RNA wird mittels in vitro Transkription 

eines entsprechenden RNA-Konstrukls hergestellt und durch Messung der optischen Dichte bei 260 nm 
(OD 260 nm) quantifiziert. Eine definierte Anzahl dieser Molekule wird mit einer bestimmten Menge 
Gesamt-RNA von naiven Huh-7 Zellen gemischt und diese Mischung mit Hilfe der Elektroporation in 
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naive Huh-7 Zellen eingeschleust. Parallel dazu wird die Gesamt-RNA eines Zellklons, der mit der in 
Figur 1 beschriebenen Methode hergestellt wurde, mit einem im Stand der Technikbekannten Veriahren 
isoliert und die Menge der darin enthaltenen HCV-RNA mittels Northern-blot unter Verwendung einer 
HCV-spezifischen RNA-Sonde und anschlieBender Quantifizierung mittels Phosphoimager bestimmt. 

5 Eine definierte Menge dieser Gesamt-RNA wird analog den in vitro Transkripten in naive Huh-7 Zellen 

transfiziert. Diese Zellen in beiden Ansatzen werden danach einer G418-Selektion unterzogen und die 
Anzahl der gebildeten Kolonien durch Auszahlen nach fixieren und anfarben mit Coomassie-Brilliant- 
Blau bestimmt. Zur Bestimmung der Transfektionseffizienz wird jedem Transfektionsansatz 1jig eines 
Plasmids zugesetzt, das die Expression der Luziferase erlaubt. Ein Aliquot der transfizierten Zellen wird 

10 nach 24 Stunden geerntet und die Luziferaseaktivitat im jeweiligen Zellysat bestimmt. Die Anzahl der 

Kolonien wird jeweils auf die Luziferaseexpression normiert. 

Fig. 10: Sequenzanalyse der 9-13 Klone. Gesamt-RNA des Zellklons 9-13, der durch Transfektion des HCV- 
RNA-Konstrukts I377/NS3-3' entstand, wurde mit einem im Stand der Technik bekannten Verfahren iso- 
15 liert und das HCV-RNA-Konstrukt von Nukleotidposition 59 bis 9386 mit Hilfe der 'long-distance RT-PCR' 

unter Verwendung der primer S59 und A9413 amplizifiert. Die PCR-Fragmente wurden kloniert und 1 1 
Klone (genannt 9-13 A - K) vollstandig sequenziert, wobei sich die Klone D und I, E und G sowie H und 
J als identisch erwiesen. Die Positionen der Aminosaureunterschiede in der NS3-5B Region zwischen 
den reklonierten HCV-RNAs und dem parentalen Konstrukt sind mit einem dicken vertikalen Strich beim 
20 jeweiligen Klon markiert. Jeder Klon wurde mit dem Restriktionsenzym Sfi 1 verdaut und das jeweilige 

Fragment in das parentale Konstrukt inseriert. Diese Klone wurden jeweils in Huh-7 Zellen transfiziert 
und die Zellen wie in Figur 1 beschrieben einer Selektion unterzogen. Die Anzahl der mit jedem Kon- 
strukt erhaltenen ZellWone ist rechts neben dem jeweiligen Konstrukt vermerkt. 

Prinzip der Replikationsbestimmung mit Hilfe eines Reportergens. Im oberen Teil der Figur ist das HCV- 
DNA-Konstrukt l 389 /Luc/NS3-3' dargestellt, bestehend aus der HCV 5' NTR (Nukleotidposition 1-389), 
dem Luziferasegen (luc), der IRES des Encephalomyocarditis Virus, dem HCV NS3-5B und der 3' NTR. 
Die Position des aktiven Zentrums der NS5B RN A- Polymerase, in das ein inaktivierender Aminosaure- 
austausch eingefuhrt wurde, ist mit 'GND' angedeutet. Die Plasmide, die fur das replikationskompetente 
bzw. das defekte HCV-RNA-Konstrukt kodieren, werden mit dem Restriktionsenzym Sea I verdaut und 
in eine in vitro Transkription mit der T7 RNA-Polymerase eingesetzt. Nach Entfernung der Matrizen-DNA 
werden die jeweiligen HCV-RNA-Konstrukte mittels Elektroporation in naive Huh-7 Zellen eingeschleust 
und diese in regelmaBigen Abstanden geerntet. 

35 Fig. 11 B: Vergleich der Luziferaseaktivitaten in Zellen transfiziert mit dem parentalen HCV-RNA-Konstrukt 
l 38 9/Luc/NS3-3Ywt (wt) Oder den folgenden Varianten: Der inaktiven RNA (318 DN), der Variante 9-1 3F 
oder der Variante 5.1. Die Zellen wurden 6 (nicht gezeigt), 24, 48, 72, 96, 120, 144 und 168 Stunden 
nach der Transfektion geerntet und die Luziferaseaktivitaten luminometrisch bestimmt. 

40 Fig. 12: Selektionierbare HCV-Vollangengenome (Konstrukte l 389 /core-3'/5.1 und l 389 /core-379-13F). 

(A) Schematische Darstellung des Vollangenkonstrukts. Der Bereich zwischen den beiden ange- 
deuteten Erkennungsstellen fur das Restriktionsenzym Sfi I entspricht den Sequenzen der hoch- 
adaptierten RNA-Varianten 5.1. oder 9-13F. 
45 (B) Anzahl der Kolonien die nach Transfektion von jeweils 0,1 ng in vitro transkribierter RNA der 

unter A dargestellten Konstrukte l 389 /core-375.1 in HUH7-Zellen erhalten wurden. Angegeben ist 
das Ergebnis eines reprasentativen Experimentes. 

(C) Nachweis autonom replizierender HCV-Vollangen-RNAs in G418-resistenten ZellWonen, die 
nach Transfektion des entsprechenden in vitro Transkripts erhalten wurden. Die Abbildung zeigt das 

50 Autoradiogramm eines Northern Blots, der mit einer Sonde gegen das neo-Resistenzgen und der 

HCV 5' NTR hybridisiert wurde. Die in Spur 1 und 2 dargestellten Kontrollen entsprechen jeweils 10 8 
Molekulen der angegebenen in vitro Transkripte, gemischt mit Gesamt-RNA aus naiven Huh-7 Zel- 
len. Die Negativkontrolle enthalt ausschlieGlich Gesamt RNA aus naiven Huh-7 Zellen (Spur 3). Die 
Spuren 4-9 enthalten 3-10 \ig Gesamt-RNA aus G418-resistenten Zellklonen, die nach Transfektion 

55 von in vitro transkribierter l 389 /core-375.1-RNA bzw. l 389 /core-3'/9-13F-RNA erhalten wurden. Die 

fur die Selektion verwendete G418-Konzentration ist jeweils angegeben. Funf der dargestellten Zell- 
Wone enthalten die hoch adaptierte RNA- Variante 5.1 (Spur 4-8), einer die adaptierte RNA- Variante 
9-1 3F (Spur 9). 



25 Fig. 11 A: 
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Fig. 13: 



HCV-RNA-Konstrukte mit einem Reportergen. (A) Bicistronische HCV-RNA-Konstrukte. Das Reporter- 
gen wird mit Hilfe einer separaten IRES translatiert. (B) Monocistronische HCV-RNA-Konstrukte. Das 
Reportergenprodukt wird als Fusionsprotein mit einem HCV-Protein exprimiert. Die beiden Anteile sind 
uber eine Erkennungssequenz fur eine virale Oder zelluiare Protease verbunden, die eine proteolytische 
Trennung der beiden fusionierten Proteinanteile erlaubt. Im gezeigten Beispiel wurden das Reportergen- 
produkt und das jeweilige HCV-Protein uber eine Erkennungssequenz fur Ubiquitin (Ub) fusioniert. 



Fig. 14: 



Tricistronisches Vollangen HCV-RNA-Konstrukt, das zusatzlich zum Resistenzgen ein Fremdgen inse- 
riert besitzt. 
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Fig. 15: 



Monocistronische HCV-RNA-Konstrukte, bei denen das Resistenzgenprodukt als Fusionsprotein mit 
dem HCV-Anteil exprimiert wird. Das Resistenzgen (RG) ist entweder als Fusionsprotein aktiv oder es 
wird so mit einer proteolytisch spaltbaren Sequenz mit dem HCV-Anteil fusioniert, daB das Resistenz- 
genprodukt durch eine zelluiare oder virale Protease vom HCV-Anteil abgespalten wird. Im gezeigten 
Beispiel wurde das Resistenzgen uber die fur Ubiquitin (Ub) kodierende Sequenz mit dem jeweiligen 
HCV-Anteil fusioniert. 



Beispiel 1 : Herstellung von HCV-RNA-Konstrukten 

20 ( A) Synthese und Klonierung eines vollstandigen HCV-Konsensusgenoms mittels RT- PCR 

[0053] Aus der Leber eines chronisch inf izierten Patienten wurde das HCV-Genom, d.h. die HCV-RNA wie nachfol- 
gend beschrieben isoliert: 

[0054] Aus ca. 100 mg Leber wurde die komplette RNA gemaB dem Verfahren von Chomczynski und Sacci (1 987, 

25 Anal. Biochem. 162, 156) isoliert. Mit 1 \iq dieser isolierten RNA wurde eine reverse Transkription mit den Primern 
A6103 (GCTATCAGCCGGTTCATCCACTGC) oder A9413 (CAGGATGGCCTATTGG CCTGGAG) und dem expand 
reverse transcriptase'- System (Boehringer Mannheim, Deutschland) nach den Vorschriften des Herstellers durchge- 
fiihrt. Mit den Produkten dieser reversen Transkription (RT) wurde eine Polymerase-Kettenreaktion (PCR=polymerase 
chain reaction) durchgefuhrt, und zwar unter Verwendung des 'expand long template'-Systems (Boehringer Mannheim, 

30 Deutschland), wobei der Puffer mit 2% Dimethylsulfoxid-Gehalt eingesetzt wurde. Nach einer Stunde bei 42°C wurde 
1/8 dieses Reaktionsansatzes in einem ersten PCR-Durchgang mit den Primern A6103 und S59 (TGTCTTCACGCA- 
GAAAGCGTCTAG) oder A9413 und S4542 (GATGAGCT CGCCGCGAAGCTGTCC) eingesetzt. Nach 40 Zyklen 
wurde 1/10 dieses Reaktionsansatzes in einem zweiten PCR-Durchgang mit den Primern S59 und A4919 (AGCACA- 
GCCCGCGTCATAGCACTCG) oder S4542 und A9386 (TTAGCTCCCCG TTCATCGGTTGG) eingesetzt. Nach 30 

35 Zyklen wurden die PCR-Produkte mittels praparativer Agarose-Gel-Elektrophorese gereinigt und die dabei eluierten 
Fragmente wurden in den Vektor pCR2.1 (Invitrogen) oder pBSK II (Stratagene) ligiert. Vier Klone von jedem Fragment 
wurden analysiert und sequenziert, und es wurde eine Konsensus-Sequenz ermittelt. Zu diesem Zweck wurden die 
DNA-Sequenzen miteinander verglichen. Die Positionen, an denen sich die Sequenz eines der Fragmente von den 
Cibrigen unterschied, wurde als unerwunschte Mutation betrachtet. Im Fall von Mehrdeutigkeiten der Sequenz wurden 

40 kurzere sich uberlappende PCR-Fragmente der betreffenden Region amplifiziert und mehrere Klone sequenziert. Auf 
diese Weise konnten zahlreiche potentielle Mutationen in jedem Fragment identif iziert und somit eine isolat-spezif ische 
Konsensussequenz etabliert werden. Diese etablierte Konsensussequenz bzw. dieses Genom gehort zum weltweit 
verbreiteten Genotyp 1b. Die nicht translatierte Region am 3'-Ende (=3' NTR) wurde mittels konventioneller PCR erhal- 
ten, wobei ein Antisense-Primer eingesetzt wurde, der die letzten 24 Nukleotide des im Stand der Technik bekannten 

45 'X-tails' (Tanaka et al., 1995, Biochem. Biophys. Res. Commun. 215, 744; und Rice, PCT/US 96/14033) abdeckt. Die 
authentische nicht translatierte Region am 5'-Ende (=5' NTR) strangabwarts vom T7 Promotor wurde mittels PCR 
erzeugt, wobei zum einen ein OligonuWeotid verwendet wurde, das einem verkurzten T7 Promotor (TAA TAC GAC TCA 
CTA TAG) und den ersten 88 NuWeotiden von HCV entspricht, und zum anderen eines der vorgenannten Plasmide ein- 
gesetzt wurde, das eines der 5' Fragmente des Genoms tragt. Aus den subgenomischen Fragmenten mit der gering- 

50 sten Anzahl an Nicht- Konsensus-Austauschen wurde ein komplettes HCV-Konsensusgenom zusammengesetzt und in 
einen modifizierten pBR322-Vektor insertiert. Abweichungen von der Konsensussequenz wurden mittels ortsgerichte- 
ter Mutagenese ("site-directed mutagenesis) beseitigt. Urn "run-off-Transkripte mit einem authentischen 3' Ende her- 
zustellen, wurde die 3'-NTR der Isolate (mit dem Ende TGT) zu AGT modif iziert (gemaB der Sequenz vom Genotyp 3 
= Klon 'WS' nach Kolykhalov et al., 1996, J. Virol. 70, 3363) und auBerdem wurde ein zusatzlicher Nukleotidaustausch 

55 an Position 9562 vorgenommen, urn die A:T Basenpaarung in der Haarnadelstruktur am 3' Ende der 3' NTR (Kolyhalov 
et al. ibid.) beizubehalten. Urn eine interne Restriktionsstelle fur das Enzym Seal zu beseitigen, wurde ferner ein sog. 
stiller ("silent") Nukleotidaustausch vorgenommen. Nach dem Zusammenfugen des Vollangen-Genoms mit passenden 
5'- und 3' NTRen wurde die komplette HCV-Sequenz Liberpruft. Dabei wurde kein ungewunschter Nukleotidaustausch 
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gefunden. 

[0055] Das auf diese Weise hergestellte HCV-Genom sollte per Definition hepatotrop sein. 

(B) Synthese selektierbarer HCV-Subgenom-Konstrukte 

5 

[0056] Unter Verwendung des unter (A) beschriebenen Konsensusgenoms wurden HCV-Subgenom-Konstrukte 
hergestellt, die das Antibiotikumresistenzgen Neomycin-Phosphotransferase (NPT) und zwei Sequenzen von internen 
Ribosomenbindungsstellen (IRES) enthalten. Die hierfur angewendeten biochemischen Verfahrenstechniken sind dem 
Fachmann bekannt und gelaufig (siehe: Sambrook, J., E.F Fritsch, T. Maniatis, 1989, Molecularcloning: a laboratory 

10 manual, 2nd ed., Cold Spring Harbour Laboratory, Cold Spring Harbor, N.Y.; Ausubel et al. (eds.), 1994, Current Proto- 
cols in Molecular Biology, Vol. 1-3, John Wiley & Sons Inc., New York). Das Antibiotikumresistenzgen wurde unmittelbar 
hinter der 5' NTR insertiert, wodurch eine bicistronische RNA erhalten wurde (siehe Fig. 1 A). Ebensogut kann das Anti- 
biotikumresistenzgen aber auch an anderer Stelle des HCV-Subgenom-Konstrukts insertiert werden, beispielsweise 
innerhalb der fur das Polyprotein kodierenden Nukleotidsequenz, wodurch eine monocistronische RNA erhalten wird 

15 (siehe Fig. 5 A) oder in die 3' NTR (siehe Fig. 5 B). Bei den IRES-Elementen handelt es sich zum einen urn eine der 
beiden HCV-IRES-Varianten Nukleotide 1-377 oder NuWeotide 1-389, und zum anderen urn die IRES des Enzephalo- 
myocarditis Virus, die die Translation der HCV Sequenz strangabwarts von den Genen fur NS2 oder NS3 bis zu dem 
authentischen 3' Ende des Genoms steuert. 

[0057] Die beiden genannten HCV-IRES-Varianten wurden wie folgt ermittelt: Auf der Basis von Deletionsanalysen 

20 der 3' Grenze der HCV- IRES (Reynolds et al. 1995, EMBO J. 14, 6010) wurden verschiedene Abschnitte der 5' NTR 
mit dem NPT Gen fusioniert und anhand von Kotransfektionen mit einem das T7 RNA Polymerase Gen enthaltenden 
Plasmid hinsichtlich der maximalen Anzahl gebildeter Kolonien analysiert. Die besten Ergebnisse wurden mit den HCV 
Sequenzen von 1-377 und 1-389 erhalten. Da sich das AUG-Startkodon des HCV Polyproteins an Position 342 befindet 
und somit in der IRES-Sequenz enthalten ist, kommt es zu einer Fusion von 12 bzw. 16 Aminosauren des HCV-Kap- 

25 sidproteins ("Core- Proteins") mit der Neomycin Phosphotransferase (siehe Fig. 1 A). 

[0058] Diese modifizierten HCV-Subgenom-Konstrukte erhielten dementsprechend die Bezeichnungen l 377 /NS2- 
3' (oder l 377 /NS3-3') und l 389 /NS2-3' (oder l 389 /NS3-3'). Sie sind in Fig. 1 A schematisch dargestellt. 
[0059] Mit in-vitro-Transkripten dieser modifizierten parentalen HCV-Subgenom-Konstrukte l 377 /NS2-3' (oder 
l 377 /NS3-3') und l 38 g/NS2-3' (oder l3 8 9/NS3-3') wurden verschiedene Zellinien und Primarzellkulturen von menschli- 

30 chen Hepatocyten transfiziert. 

[0060] Als parallele Negativ-Kontrolle zu alien Transfektionsexperimenten wurde zu jedem modifizierten parentalen 
HCV-Subgenom-Konstrukt ein entsprechend modifiziertes aber defektes Subgenom konstruiert, das sich von dem par- 
entalen dadurch unterscheidet, daB es innerhalb des Leserasters eine Deletion von 10 Aminosauren aufweist, die das 
aktive Zentrum der NS5B RNA Polymerase umfaBt (Behrens et al., 1996, EMBO J. 15, 12; und Lohmann et al., 1997, 

35 J. Virol. 71, 8416). 

(C) Svnthese selektierbarer HCV-Genom -Konstrukte 

[0061] Ein NS2-3' Subgenomkonstrukt, das am 5' Ende mit einem Fragment des Luziferasegens und der vollstan- 
40 digen EMCV-IRES verbunden ist, wurde mitNcol und Spel restringiert und mittels praparativer Agarosegelelektropho- 
rese gereinigt. Der so erhaltene Vektor wurde in einer 3-Faktor Ligation mit einem Ncol/Notl-HCV-Fragment, 
entsprechend den Nukleotidpositionen 342 bis 1968 des HCV-Genoms und mit einem Not l/Spe I- Fragment, entspre- 
chend den Nukleotidpositionen 1968-9605 ligiert. Das entstandene Konstrukt, bei dem das vollstandige HCV-Leser- 
aster und die 3' NTR stromabwarts dem Luziferasegenfragment und der EMCV-IRES liegen, wurde danach mit Pmel 
45 und Spel restringiert und mit dem analog restringierten 1 389 /NS3-37wt- Subgenomkonstrukt- Vektor ligiert. Dieses selek- 
tionierbare HCV-Genomkonstrukt ist in Fig. 4 dargestellt. 

(D) Herstellunq von den HCV-RNA-Konstrukten entsprechenden in-vitro-Trnaskripten 

50 [0062] Die vorstehend beschriebenen gereinigten Plasmid DNAs wurden mit Seal linearisiert und nach Phe- 
nol/Chloroform-Extraktion und Isopropanol -Prazipitation in eine In-vitro-Trankriptionsreaktion eingesetzt unter Verwen- 
dung der folgenden Komponenten: 80 mM HEPES, pH 7.5, 12,5 mM MgCl2, 2 mM Spermidin, 40 mM Dithiothreitol, 2 
mM von jedem NTP, 1 Einheit RNasin/|ul, 50 ^ig/ml restringierte DNA und ca. 2 Einheiten/|jl T7 RNA Polymerase. Nach 
2 Std. bei 37°C wurde die Halfte der Menge an T7 Polymerase zugegeben und der Reaktionsansatz weitere 2h inku- 

55 biert. Zur Entfernung von DNA wurde die Mischung mit saurem Phenol extrahiert (U. Kedzierski, J.C. Porte, 1991, Bio 
Techniques 10, 210), mit Isopropanol prazipitiert, das Pellet in Wasser gelost und mit DNase (2 Einheiten pro [ig DNA) 
fur 60 Min. bei 37°C inkubiert. Nach anschlieBender Extraktion mit saurem Phenol, saurem Phenol/Chloroform und 
Chloroform und Isopropanol- Prazipitation wurde die geloste RNA mittel optischer Dichtemessungen quantifiziert und 
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ihre Unversehrtheit mittels Formaldehyd-Agarose-Gelelektrophorese uberpruft. 
Beispiel 2 : Transfektionsexperimente mit der Hepatomazellinie Huh-7 

5 [0063] Bei samtlichen Transfektionsexperimenten wurde sorgfaltig darauf geachtet, daB jegliche Matrizen-DNA 
zuvor entfernt worden war, urn zu vermeiden, daB solche DNA in transf izierte Zellen integrieren und diesen unabhangig 
von einer HCV-Replikation eine Neomycin- Resistenz vermitteln konnte. Deshalb wurde im AnschluB an die in-vitro- 
Transkription ( Beispiel 1 D) die Reaktionsmischung mit 2 Einheiten DNase pro jug DNA fur 60 Min. bei 37°C behandelt 
und mit saurem Phenol, saurem Phenol/Chloroform und Chloroform extrahiert. Vor der Verwendung fur die Transfektion 

10 wurde die prazipitierte RNA mittels Formaldehyd Agarose Gel Elektrophorese analysiert. 

[0064] Es wurden drei separate Transf ektionsxperimente mit der hoch differenzierten humanen Hepatomazellinie 
Huh-7 (gemaB Nakabayashi et al. 1982, Cancer Res. 42, 3858) durchgefiihrt. Dabei wurde jeweils 15 jug RNA in 8 x 
10 6 Huh-7-Zellen mit Hilfe der Elektroporation eingebracht und diese Zellen anschlieBend in Kulturschalen von 10 cm 
Durchmesser ausgesat. 24 Stunden nach der Aussaat wurde Neomycin (= G418) in einer Endkonzentration von 1 

15 mg/ml zugegeben. Das Kulturmedium wurde zweimal pro Woche gewechselt. Nach 3 - 5 Wochen waren kleine Kolo- 
nien erkennbar, die isoliert und unter den gleichen Kulturbedingungen passagiert wurden. 

[0065] Die Zellklone, die im Verlauf des ersten Experiments erhalten wurden, wurden isoliert und subpassagiert. 
Wahrend dieser Prozedur starben die meisten Klone und die Endausbeute betrug nur noch 9 Klone von Zellen, die mit 
den parentalen HCV-Subgenom-Konstrukten transfiziert worden waren und 1 Klon (Klone 8-1) von Zellen, die mit 
20 einem defekten HCV-Genom-Konstrukt, namlich einer defekten NS2-3' HCV-RNA transfiziert worden waren. AuBer 
einer verkiirzten Verdopplungszeit und dem gelegentlichen Auftreten von irregular geformten Zellen wurden keine 
bestandigen morphologischen Unterschiede zwischen diesen 9 Zellklonen und dem einen Zellklon (Klon 8-1) oder den 
parentalen Huh-7 Zellen gefunden. 

[0066] Die Hauptkriterien fur funktionierende HCV-Genomkonstrukte sind die Bildung von viraler RNA mit korrekter 
25 GroBe und die Abwesenheit von (integrierter) Plasmid DNA, die eine G41 8- Resistenz ubertragen bzw. vermitteln 
konnte. 

[0067] Urn die HCV-RNA in den Huh-7-Zellen zu bestimmen, wurde die Gesamt-RNA isoliert und mittels des gan- 
gigen Northern-Blot Verfahrens unter Verwendung einer Plusstrang-spezifischen Ribosonde (= RNA-Sonde) analy- 
siert. Hierfur wurde von den jeweiligen Zellklonen Gesamt-RNA nach der Methode von Chomczynski und Sacchi 1987, 

30 Anal. Biochem. 162, 156 isoliert, und 10 jug RNA, was dem Gesamt-RNA-Gehalt von 0,5 - 1 x 10 6 Zellen entspricht, 
mittels denaturierender Formaldehyd-Agarose-Gelelektrophorese aufgetrennt (Spuren 3 bis 12 der Fig. 1 B). Als Gro- 
Benmarker mit authentischer Sequenz wurden gleichzeitig 10 9 in-vitro-Transkripte (ivtr.), die zu den l 389 /NS2-37wt oder 
den l 389 /NS3-3'/wt Replikon-RNAs korrespondieren, mit aufgetrennt (Spur 1 bzw. Spur 2). Die aufgetrennte RNA wurde 
auf Nylon-Membranen transferiert und mit radioaktiv markierter Plusstrang-spezifischer RNA-Sonde, die komplemen- 

35 tar zu dem kompletten NPT-Gen und der HCV-IRES von NuWeotid 377 bis Nukleotid 1 war, hybridisiert. Die Positionen 
der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angegeben, die GroBen (Anzahlen der 
Nukleotide) der RNA-Marker sind links von Spur 1 angegeben. Die RNA Marker-Fragmente enthalten HCV-Sequenzen 
und hybridisieren deshalb mit der Ribosonde (= RNA-Sonde). Die Ergebnisse dieser Analyse sind in Fig. 1 B darge- 
stellt. 

40 [0068] Mit Ausnahme des mit dem defekten HCV-Genom-Konstrukt transfizierten Klons 8-1 , lieferten alle Zellklone 
homogene HCV-RNAs korrekter Lange (ca. 8640 Nukleotide im Fall des NS2-3' und ca. 7970 Nukleotide im Fall des 
NS3-3' Replikons). Dieser Befund ist ein Indizdafur, daBdiefunktionalen Repl ikons bzw. diefunktionalen HCV-Genom- 
Konstrukte die G418 Resistenz ubertragen. Urn auszuschlieBen, daB die G418 Resistenz auf eine Plasmid-DNA 
zuriickzufuhren ist, die in das Genom der Huh-7 Wirtszelle integriert ist und unter der Kontrolle eines zellularen Promo- 

45 tors transkribiert wird, wurde von jedem Klon die DNA mittels einer NPT-Gen-spezifischen PCR untersucht. Hierbei 
wurde aus den selektierten Huh-7-Zellklonen die DNA mittels Verdau mit Proteinase K (40jig/ml, 1 h, 37°C) in 
lOmMTris, pH7,5, 1mM EDTA, 0,5% SDS und anschlieBender Extraktion mit Phenol, Phenol/Chloroform und Isopro- 
panolprazipitation isoliert. Das DNA-Prazipitat wurde in 10 mM Tris (pH 7,5) und 1 mM EDTA gelost und 1 Stunde mit 
Rnase A inkubiert. Im AnschluB an eine Phenol/Chloroform Extraktion und Ethanol Prazipitation wurde 1 ng DNA, ent- 

50 sprechend 4 - 8 x 10 4 Zellen, mittels PCR unter Einsatz NPT-Gen-spezifischer Primer (5'-TCAAGACCGACCTG 
TCCGGTGCCC-3' und 5'-CTTGAGCCTGGCGAACAGTTCGGC-3') analysiert und ein DNA- Fragment bestehend aus 
379 Nukleotiden erzeugt. Die Spezifitat des PCR-Produkts wurde mittels Southern Blot Verfahren nachgewiesen, 
wobei ein Digoxigenin-markiertes DNA Fragment eingesetzt wurde, das zu dem NPT-Gen korrespondiert. Als Positiv- 
Kontrollen (zum Nachweis etwa vorhandener kontaminierender NuWeinsauren) wurde das PCR-Verfahren mit 10 7 

55 Plasmid Molekulen oder 1 jig DNA aus einer BHK Zellinie, die stabil mit einem Neomycin-Resistenz-Gen transfiziert 
war, durchgefiihrt, und als Negativ-Kontrolle wurde die PCR mit denselben Reagenzien aber ohne zugesetzte DNA 
durchgefiihrt. 

Die Ergebnisse dieser Untersuchung sind in Fig. 1 C dargestellt. Die Spuren 1 und 2 reprasentieren die Positiv-Korrtrol- 
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len, Spur 13 reprasentiert die Negativ-Kontrolle. Die Zahlenangaben links der Spur 1 bezeichnen die GroBe der 
Nukleotid-Marker-Molekiile. AuBer in Klon 7-3 (Fig. 1C P Spur 3), der von Zellen nach Transfektion mit einem NS2-3' 
Replikon/NS2-3'HCV-Genom-Konstrukt stammt, und in Klon 8-1 (Fig. 1C, Spur 12), der von Zellen nach Transfektion 
mit einem defekten HCV-Genom-Konstrukt stammt, war in keinem Zellklon eine NPT-DNA nachweisbar. Dieser Befund 

5 ist ein weiteres Indiz dafiir, daf3 die G418 Resistenz der meisten Klone durch die replizierende HCV-RNA vermittelt 
wurde. Aber auch unabhangig von diesen Ergebnissen ist es unwahrscheinlich, daB HCV-RNAs mit korrekler GroBe 
von integrierter Plasmid DNA erzeugt wird, denn die fur die in-vitro-Transkription verwendeten Plasmide enthalten 
weder einen eukaryontischen Promotor noch ein Polyadenylierungssignal. Im Fall des Klons 7-3 ist die Resistenz des- 
halb hochst wahrscheinlich sowohl durch das HCV-RNA-Konstrukt bzw. die replizierende HCV-RNA als auch durch 

10 eine integrierte NPT DNA Sequenz vermittelt worden, wahrend die Resistenz der Zellen von Klon 8-1 ausschlieBlich 
auf die integrierte Plasmid DNA zuruckzufuhren ist. 

[0069] Urn zu bestatigen, daB die G41 8 Resistenz von einer autonom replizierenden HCV-RNA vermittelt ist, wurde 
der Klon 9-13 (Fig. 1 B, Spur 11) weiteren Tests unterworfen. Klon 8-1, der integrierte Kopien des NPT-Gens tragt, 
wurde uberall als Negativkontrolle eingesetzt. Mit dem Ziel, die Anwesenheit von NPT-DNA im Klon 9-13 rigoros aus- 

15 zuschlieBen, wurde eine PCR durchgefuhrt, die den Nachweis von < 1 000 NPT-Gen-Kopien in ~ 40.000 Zellen erlaubt. 
Das Ergebnis dieser PCR ist in Fig. 2A dargestellt. Im einzelnen wurde bei dieser PCR wie folgt verfahren: 
Es wurden jeweils 10 6 - 10 2 Plasmid Molekule (l 3 7 7 /NS3-37wt) entweder direkt (Spuren 7-11) oder nach Zugabe von 
jeweils 1 [ig 9-13 DNA (Spuren 2 - 6) in dem Test eingesetzt. Die Spezifitat der amplifizierten DNA Fragment wurde mit- 
tels Southern Blot unter Verwendung einer NPT-spezifischen Sonde bestimmt. Eine PCR ohne DNA-Sonde wurde als 

20 Negativ-Kontrolle durchgefuhrt (Spur 12). 

Selbst mit dieser sensitiven Methode wurde in einem ^g DNA des Zellklons 9-13 keine Plasmid DNA gefunden (Spur 
1). Um die Menge an HCV Plus- und Minusstrang RNAs in diesen Zellen abzuschatzen, wurde eine Verdunnungsreihe 
von Gesamt-RNA mit dem Northern-Blot-Verfahren unter Verwendung einer Plus- oder Minusstrang-spezifischen 
radioaktiv markierten Ribosonde (= RNA-Sonde) analysiert. Hierfur wurden jeweils 8, 4 oder 2 jig Gesamt-RNA, die 

25 aus den Zellklonen 9-13 und 8-1 isoliert worden waren, parallel zu bekannten Mengen analoger in-vitro-Transkripte mit 
Plus- oder Minusstrang- Polaritat (Kontroll-RNAs) im Northern-Blot-Verfahren analysiert und anschlieBend einer Hybri- 
disierung unterworfen. Die Hybridisierung wurde mit einer Plusstrang-spezifischen Ribosonde, die das komplette NPT- 
Gen und die HCV-IRES abdeckte ('plusstrand', obere Bildtafel), Oder mit einer Minusstrang-spezifischen RNA-Sonde, 
die zu der NS3-Sequenz komplementar war ('minusstrand', untere Bildtafel) durchgefuhrt. Die Pfeile markieren die 

30 Positionen von Replikon-RNA. Die Ergebnisse dieser Analyse sind in Fig. 2 B dargestellt. 

Im Fall des Plusstrangs wurden ca. 10 8 Kopien/|ug Gesamt-RNA nachgewiesen, was 1000 - 5000 HCV-RNA-Molekulen 
pro Zelle entspricht, wahrend die Menge an Minusstrang-RNA 5- bis 10-fach niedriger war. Dieses Ergebnis stimmt mit 
der Annahme Liberein, daB die Minusstrang RNAdie replikative Zwischenform bzw. Zwischenkopie ist, die als Vorlage 
fur die Synthese der Plusstrang Molekule dient. 

35 Da die Reaktion im wesentlichen von der viralen RNA-abhangigen RNA Polymerase katalysiert wird, sollte die Syn- 
these der HCV-RNAs resistent gegen Dactinomycin sein, einem Antibiotikum, das selektiv die RNA-Synthese von 
DNA-Matrizen inhibiert, nicht jedoch die RNA-Synthese von RNA-Matrizen. Um diese Vermutung zu bestatigen, wur- 
den Zellen mit [ 3 H] Uridin in Anwesenheit von Dactinomycin inkubiert, die radioaktiv markierten RNAs extrahiert, mittels 
denaturierender Agarose-Gel-Elektrophorese aufgetrennt und mit Hilfe eines handelsublichen Bio-lmagers unter Ver- 

40 wendung einer [ 3 H]-sensitiven Bildplatte analysiert. Hierfur wurden jeweils ca. 5 x 10 5 Zellen der Klone 9-13 und 8-1 
mit 100 ill Ci [ 3 H]Uridin fur 16 Std. in Abwesenheit (-) oder Gegenwart (+) von 4 ^g/ml Dactinomycin (Dact) inkubiert. 
Im AnschluB an diese Markierungsreaktion wurde die Gesamt-RNA prapariert und mittels Formaldehyd-Agarose-Gel- 
Elektrophorese analysiert. In den beiden ersten Spuren ist nur 1/10 der Gesamt-RNA dargestellt. Die radioaktiv mar- 
kierte RNA wurden mit einem BAS-2500 Bio-lmager (Firma Fuji) sichtbar gemacht. 

45 Die Ergebnisse dieser Analyse sind in Fig. 2 C dargestellt. In Ubereinstimmung mit dem Inhibitor-Prof il der NS5B Poly- 
merase (Behrens et al., 1996, EMBOJ. 15, 12 und Lohmann et al., 1997, J Virol. 71 , 8416) war die Replikation der HCV 
RNA nicht durch Dactinomycin beeinfluBt worden, wahrend die Synthese von zellularer RNA gehemmt worden war. Um 
die Identitat der viralen RNA zu bestatigen, wurde eine RT-PCR zur Reklonierung der replizierten Sequenzen durchge- 
fuhrt. Die Sequenzanalyse der reklonierten RNA zeigte, daB die RNA in dem Klon 9-13 HCV-spezifisch ist und mit dem 

50 transfizierten Transkript des HCV-Konstrukts l 3 7 7 /NS3-3'Awt Libereinstimmt. 

[0070] Zur Analyse der viralen Proteine wurden die betreffenden Zellen zunachst metabolisch mit [ 35 S] Methio- 
nin/Cystein radioaktiv markiert, anschlieBend lysiert und danach die HCV-spezifischen Proteine mittels Immunoprazi- 
pitation aus den Zell-Lysaten isoliert. Die Ergebnisse dieser Analysen sind in Fig. 3 A dargestellt. Im einzelnen wurde 
dabei wie folgt verfahren: Zellen der Zellklone 9-13 (wt) und 8-1 (A) waren durch Behandlung fur 16 Stunden mit einer 

55 dem Fachmann gelaufigen und im Handel erhaltlichen Protein-Markierungs-Mischung (z.B. NEN Life Science) metabo- 
lisch radioaktiv markiert worden. Mittels Immunoprazipitation (IP) unter nicht-denaturierenden Bedingungen (z.B. nach 
Bartenschlager et al., 1995, J. Virol. 69, 7519) und unter Verwendung von drei verschiedenen Antiseren (3/4, 5A, 5B, 
gemaB Markierung am oberen Ende der Spuren 1 bis 12) waren die HCV-spezifischen Proteine vom Zell-Lysat abge- 
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trennt worden.. Die Immunokomplexe wurden mittels Tricine SDS-PAGE analysiert und mittels Autoradiographie sicht- 
bar gemacht. Um authentische GroBenmarker zu erhalten, wurde das homologe Replikonkonstrukt l 3 7 7 /NS3-3'/wt einer 
transienten Expression mit dem Vaccinia Virus T7-Hybrid System in Huh-7 Zellen unterworfen. Die dabei erhaltenen 
Produkte waren als GroRenmarker (Spuren 7 - 9) parallel zu den Zellen der Klone 9-13 und 8-1 behandelt worden. 
5 Identifizierte HCV-Proteine sind am linken Rand von Spur 1 markiert, die Molekulargewichte (in Kilodalton) sind am 
rechten Rand von Spur 9 angegeben. Es ist anzumerken, daB das verwendete NS3/4-spezifische Antiserum ('3/4') 
bevorzugt mit NS4A und NS4B reagiert, was zu einer Unter representation von NS3 fuhrt. 

[0071] Alle viralen Antigene waren eindeutig nachweisbar und ihre apparenten Molekulargewichte zeigten keine 
Abweichungen gegenuber denjenigen, die nach transienter Expression desselben bicistronischen HCV-RNA-Kon- 

10 strukts in den ursprunglichen Huh-7 Zellen ermittelt wurden. Um die subzellulare Verteilung der viralen Antigene zu 
bestimmen, wurde eine Immunof luoreszenz-Nachweisreaktion unter Einsatz von NS3- und NS5A-spezif ischen Antise- 
ren durchgefuhrt (z.B. nach Bartenschlager et al., 1995, J. Virol. 69, 7519). H i erf ur wurden Zellen der Klone 9-13 (wt) 
und 8-1 (A) 24 Std. nach dem Aussaen auf Deckglasern mit Methanol/Azeton fixiert und mit polyklonalen NS3- Oder 
NS5A-spezifischen Antiseren inkubiert. Die gebundenen Antikorper wurden mit einem kommerziell erhaltlichen FITC- 

15 konjugierten Anti-Kaninchen-Antiserum sichtbar gemacht. Zur Unterdruckung unspezifischer Fluoreszenzsignale wur- 
den die Zellen mit dem Farbstoff 'Evans Blue' gegengefarbt. 

[0072] Die Ergebnisse dieses Nachweistests sind in Fig. 3 B dargestellt. Mit beiden Antiseren war eine starke Fluo- 
reszenz im Zytoplasma nachweisbar. Die NS5A-spez if ischen Antiseren fiihrten auBerdem zu einer schwachen Zell- 
kern-Fluoreszenz, was darauf hindeutet, daB zumindest kleine Mengen dieses Antigens auch zum Zellkern gelangen. 

20 Die generell dominierende Prasenz der viralen Antigene im Zytoplasma ist jedoch ein starkes Indiz dafur, daB die HCV- 
RNA Replikation im Zytoplasma stattfindet — so wie das bei den meisten RNA-Viren der Fall ist. 
[0073] Diese Ergebnisse belegen klar, daB mit dem hier beschriebenen Versuchsansatz der Aufbau eines Zellkul- 
tursystems fur das HCV gelungen ist, dessen Eff izienz alles bisher bekannte um GroBenordnungen ubersteigt und erst- 
malig den Nachweis viral er NuWeinsauren und Proteine mit konventionellen und bewahrten biochemischen Methoden 

25 erlaubt. Erst diese Effizienz erlaubt uberhaupt detailierte Untersuchungen der HCV-Pathogenese, genetische Analysen 
verschiedener HCV-Funktionen und ein genaues Studium der Virus-/Wirtszellwechselwirkungen, wodurch sich neue 
Ansatzpunkte fur die Entwicklung einer antiviralen Therapie definieren lassen. 

Beispiel 3 ; Transfektion von Huh-7 Zellen mit HCV-Genomkonstrukten 

30 

[0074] Huh-7 Zellen werden wie in Beispiel 2 beschrieben transf iziert und selektioniert, wobei hier jedoch selektio- 
nierbare Konstrukte verwendet werden, die das vollstandige Virusgenom enthalten. Die erhaltenen Zellklone werden 
analog dem Beispiel 2 mittels PCR auf Abwesenheit von HCV-DNA untersucht und die produktive Replikation der HCV- 
RNA wird danach mittels Northern Blot, [ 3 H]Uridinmarkierung in Anwesenheit von Dactinomycin, Nachweis der viralen 

35 Proteine bzw. Antigene vorzugsweise mit Hilfe des Western Blots, der Immunoprazipitation oder der Immunf luoreszenz 
nachgewiesen. Im Gegensatz zu den im Beispiel 2 beschriebenen Ansatzen lassen sich mit dem hier beschriebenen 
Konstrukt auBerdem vollstandige und sehr wahrscheinlich infektiose Viren erhalten, was bei den dort (in Beispiel 2) 
beschriebenen Subgenomkonstrukten nicht der Fall ist. Diese Viren, die in der Zelle und dem Zellkulturuberstand vor- 
handen sind, werden beispielsweise mittels Ultrazentrifugation, Immunprazipitation oder Fallung mit Polyethylenglykol 

40 konzentriert und alle exogenen, d.h. nicht im Viruspartikel eingebauten NuWeinsauren werden mittels Inkubation mit 
Nukleasen (RNase, DNase, Mikrococusnuklease) verdaut. Auf diese Weise lassen sich alle kontaminierenden NuWe- 
insauren, die nicht im schiitzenden Viruspartikel enthalten sind, entfernen. Die geschutzte virale RNA wird nach Inak- 
tivierung der Nukleasen, beispielsweise mittels Inkubation mit Proteinase K in einem SDS-haltigen Puffer durch 
Extraktion mit Phenol und Phenol/Chloroform isoliert und mittels Northern Blot oder RT-PCR unter Verwendung HCV- 

45 spezifischer Primer nachgewiesen. Auch in diesem Versuchsansatz ist die Kombination des beschriebenen HCV-Kon- 
sensusgenoms mit einem Selektionsmarker entscheidend fur die effiziente Produktion von viraler RNA, viralem Protein 
und damit von HCV-Partikeln. 

Beispiel 4 : Herstellung und Anwendung eines HCV- RNA Konstrukts, bei dem das Resistenzgen iiber ein Ribo- 
50 zym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-Subgenom-Sequenz verbunden ist. 

[0075] Es wird ein HCV-RNA-Konstrukt gemaB Beispiel 1 oder Beispiel 3 hergestellt, bei dem ein Antibiotikumresi- 
stenzgen iiber ein Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. Sol- 
che Konstrukte sind in Fig. 7 schematisch dargestellt. Huh-7 Zellen werden wie in Beispiel 2 beschrieben mit diesem 
55 HCV-RNA-Konstrukt transfiziert. Nach der Transfektion in die Zellen erfolgt zunachst die Selektion mit dem entspre- 
chenden Antibiotikum. In den dabei erhaltenen Zellklonen wird das einWonierte Ribozym aktiviert oder, im Fall eines 
Konstrukts, das eine Erkennungsstelle fur ein Ribozym tragt, wird das Ribozym in die Zelle eingeschleust (z.B. mittels 
Transfektion eines Ribozymkonstrukts oder Infektion mit einem viralen Expressionsvektor, in den das entsprechende 
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Ribozym eingesetzt wurde). In beiden Fallen wird durch die ribozymvermittelte Spaltung das Resistenzgen von der 
HCV-RNA-Sequenz abgetrennt. Das Ergebnis ist im Fall des HCV-Genom-Konstrukts ein authentisches HCV-Genom 
ohne Resistenzgen, das zur Bildung authentischer infektioser Viruspartikel befahigt ist. Im Fall des HCV-Subgenom- 
Konstrukts entsteht ein HCV-Replikon ohne Resistenzgen. 

5 

Beispiel 5 : Kotransfektion eines HCV-RNA-Konstrukts mit einem separaten Luziferase-Transfektionskonstrukt 

[0076] Es wird ein HCV-RNA-Konstrukt gemaB Beispiel 1 (A) oder Beispiel 3 oder Beispiel 4 hergestellt. Parallel 
dazu wird ein Transfektionskonstrukt hergestellt, welches das Luziferasegen umfaBt, wobei dieses Luziferasegen ver- 

10 mittels einer ersten NuWeotidsequenz, die fur eine HCV-Protease- (z.B. NS3-Protease-) Spaltungsstelle kodiert, mit 
einer zweiten NuWeotidsequenz, die fur ein anderes Protein oder einen Teil eines anderen Proteins kodiert, verbunden 
ist. HCV-RNA-Konstrukt und Transfektionskonstrukt werden in beliebige Wirtszellen, vorzugsweise Hepatomazellen, 
insbesondere Huh-7-Zellen, eingeschleust. Dies kann auf die in Beispiel 2 beschriebene Art und Weise geschehen. 
Das Produkt des modifizierten Luziferasegens ist ein Luziferase-Fusionsprotein, in dem die Luzif erase auf Grund der 

15 Fusion mit dem Fremdanteil inaktiv ist. In transfizierten Zellen mit hoher HCV-Replikation wird das Fusionsprotein, das 
ja eine Schnittstelle fur eine HCV-Protease enthalt, gespalten und damit die aktive Form der Luziferase freigesetzt, die 
sich durch luminometrische Messung bestimmen laBt. Wird die Replikation des HCV-RNA-Konstrukts gehemmt, wird 
das Fusionsprotein nicht gespalten und keine aktive Luziferase freigesetzt. Infolgedessen ist die quantitative Bestim- 
mung der Luziferase ein MaB fur die Replikation des HCV-Subgenom-Konstrukts. Anstelle des Luziferasegens kann 

20 ebensogut ein anderes Reportergen verwendet werden, das in analoger Weise modifiziert ist, so daB seine Expression 
von der Virusreplikation abhangt, obwohl dieses Reportergen nicht Bestandteil des HCV-Subgenom-Konstrukts ist. Es 
kann auch ein zellulares Protein, welches durch die HCV-Proteine oder Nukleinsaure inaktiviert oder aktiviert wird, als 
sogenannter Surrogatmarker verwendet werden. In diesem Fall ist die Expression bzw. Aktivitat dieses Surrogatmark- 
ers ein MaB fur die Replikation der viralen DNA. 

25 

Beispiel 6 : Herstellung von HCV-Subgenom-Konstrukten mit integrierten Fremdgenen zur Verwendung als 
leberzellspezif ische Genfahren fur die Gentherapie 

[0077] Diese rekombinanten und selektionierbaren HCV-Subgenom-Konstrukte werden in trans-komplementie- 
30 rende Helferzellinien transfiziert, d.h. in Zellinien, die induzierbar oder konstitutiv die fehlenden Funktionen (beispiels- 
weise die Strukturproteine) exprimieren. Zellklone, die ein funktionelles HCV-Subgenom-Konstrukt enthalten, lassen 
sich durch entsprechende Selektion etablieren. Die von der Wirtszelle exprimierten Virus-Strukturproteine erlauben die 
Bildung von Viruspartikel n, in die die RNA der HCV-Subgenom-Konstrukte eingeschleust wird. Das Ergebnis sind also 
virus-ahnliche Partikel, die ein erfindungsgemaBes HCV-Subgenom-Konstrukt einschlieBlich des einWonierten Fremd- 
35 gens enthalten und die dieses mittels Infektion auf andere Zellen ubertragen konnen. Ein Beispiel fur ein solches Kon- 
strukt ist in Fig. 8 dargestellt. Es besteht auch die Moglichkeit, das hier beschriebene erfindungsgemaBe HCV- 
Subgenom-Konstrukt mit integriertem Fremdgen direkt als Expressionsvektor einzusetzen. Dabei wird analog dem vor- 
genannten Verfahren vorgegangen, allerdings mit dem Unterschied, daB Zellinien transfiziert waden, die keine trans- 
komplementierenden Faktoren exprimieren. In diesem Fall dient das HCV-Konstrukt also lediglich als 
40 Expressionsvektor. 

Beispiel 7 : Herstellung zellkultur-adaptierter HCV-RNA-Konstrukte 

(A) Isolationsverfahren 

45 

[0078] Fur die Bestimmung adaptiver Mutationen und die Herstellung zellkultur-adaptierter HCV-RNA-Konstrukte 
wurde wie folgt verfahren: Zellen wurden mit einem HCV-RNA-Konstrukt wie unter den Beispielen 1 und 2 beschrieben 
transfiziert und G418-resistente Zellklone hergestellt. Zur Bestimmung der Replikationskompetenz (darunter wird in 
diesem Zusammenhang die Anzahl G418-resistenter Zellklone verstanden, die pro Mikrogramm transfizierter HCV- 

50 RNA bzw. HCV-RNA-Konstrukt erhalten wird) wurde exemplarisch die Gesamt-RNA aus einem der Zellklone, genannt 
9-13 (Fig. 1B, Spur 11) isoliert und die Menge der darin enthaltenen HCV-RNA mittels Northern-blot wie in Fig. 2 B 
beschrieben bestimmt. 10 Mikrogramm der Gesamt-RNA, die ca. 10 9 Molekule HCV-RNA enthielt, wurde anschlieBend 
per Elektroporation in naive Huh-7 Zellen eingeschleust (Fig. 9). Parallel dazu wurden 10 9 in vitro Transkripte der ana- 
logen neo-HCV-RNA, die mit isolierter Gesamt-RNA aus naTven Huh-7 Zellen auf eine Gesamt-RNA-Menge von 10 [ig 

55 aufgefullt worden war, in naive Huh-7 Zellen transfiziert. Nach Selektion mit G418 wurde die Anzahl der Zellkolonien, 
ausgedruckt in 'colony forming units (cfu) pro Mikrogramm RNA' in den beiden Ansatzen bestimmt. Bei einer Konzen- 
tration von 500 ^ig/ml G418 im Selektionsmedium betrug die Zahl der Kolonien, die mit der in der isolierten Gesamt- 
RNA enthaltenen HCV-RNA erhalten wurde, ca. 100.000 cfu pro Mikrogramm HCV-RNA. Dagegen wurden mitdersel- 
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ben Menge in vitro transkribierter HCV-RNA nur 30 - 50 Kolonien erhalten. Dieses Ergebnis belegt, daB die spezifische 
Infektiositat der HCV-RNA, die aus den Zellklonen isoliert wurde, ca. 1 .000 - 10.000-fach hoher ist als die Infektiositat 
der analogen in vitro Transkripte. Das methodische Vorgehen ist in Fig. 9 dargestellt. 

[0079] Mit Hilfe der long-distance RT-PCR' wurde die HCV-RNA aus der Gesamt-RNA der 9-13 Zellen amplif iziert, 
5 die PCR-Amplifikate kloniert und zahlreiche Klone sequenziert. Ein Vergleich der Sequenzen dieser reklonierten RNAs 
mit der Sequenz der RNA, die urspriinglich in die naiiven Huh-7 Zellen eingeschleust wurde ergab, daB die reklonierten 
RNAs zahlreiche Aminosaureaustausche besaBen, die uber die gesamte HCV-Sequenz verteilt waren (Fig. 10). Sfi\- 
Fragmente dieser reklonierten Mutanten wurden im Austausch gegen das analoge Sfil-Fragment des ursprunglichen 
Replikonkonstrukts in dieses eingefuhrt und RNAs der jeweiligen Mutanten wurden in naive Huh-7 Zellen einge- 
10 schleust. Nach Selektion mit G41 8 wurde dann fur jede HCV-RNA-Mutante die Zahl der gebildeten Kolonien bestimmt. 
Wahrend mit der Ausgangs-RNA nur 30 - 50 Kolonien pro Mikrogramm RNA erhalten wurde war die Koloniezahl bei 
zwei der reklonierten Varianten deutlich hoher (Fig. 10). Im Fall der HCV-RNA-Konstrukte 9-131 und 9-13C betrug die 
spezifische Infektiositat 100 - 1.000 cfu pro Mikrogramm RNA und beim 9-1 3F Replikon sogar 1.000 - 10.000 cfu pro 
Mikrogramm RNA. Diese Ergebnisse zeigen, daB die Aminosaureaustausche in dem analysierten NS3-5B-Bereich der 
15 Mutanten 9-131, 9-1 3C und insbesondere 9-13F zu einer deutlichen Erhohung der Replikationskompetenz fuhrten. 
Demgegenuber waren alle anderen HCV-RNA-Konstrukte (9-13 A, B, G, H und K) nicht mehr replikationskompetent, 
enthielten also letale Mutationen. 

[0080] Zwecks Beantwortung der Frage, welche der Aminosaureaustausche im 9-13F-Konstrukt zur Steigerung 
der Replikation fuhrten, wurden die Austausche einzeln oder in Kombination in das Ausgangs-HCV-RNA-Konstrukt ein- 

20 gefuhrt und die entsprechenden RNAs in naive Huh-7 Zellen eingeschleust. Das Ergebnis der Transfektionen mit die- 
sen RNAs ist in Tabelle 1 zusammengefaBt. Daraus wird ersichtlich, daB im vorliegenden Beispiel die hohe 
Replikationskompetenz durch mehrere Mutationen bedingt ist. Den groBten Beitrag leisten die Aminosaureaustausche 
in den HCV-RNA-Abschnitten NS5A und NS4B. Auch die einzelnen Austausche in der NS3-Region leisten einen Bei- 
trag, der moglicherweise auf einem Synergismus dieser Einzelaustausche beruht. 

25 Diese Befunde belegen, daB es durch die G418-Selektion der Zellen, die mit den neo-HCV-RNA-Konstrukten transfi- 
ziert wurden, zur Anreicherung solcher HCV-RNAs kam, die eine deutlich hdhere Replikationskompetenz hatten. Mit 
dem hier beschriebenen Versuchsansatz lassen sich HCV-RNA-Konstrukte mit sehr unterschiedlicher Replikationseffi- 
zienz selektionieren. Je hoher die Konzentration des Antibiotikums in dem Selektionsmedium ist, in/auf dem die HCV- 
RNA-Konstrukt-haltigen Zellen zwecks Selektion kultiviert werden, desto hoher muB der Grad an adaptiven Mutationen 

30 und damit die Replikationseffizienz in den betreffenden HCV-RNA-Konstrukten sein, damit die Zellen auswachsen kon- 
nen. Werden die Selektionen mit niedrigeren Antibiotikum-Konzentrationen durchgefuhrt, konnen auch solche Zellen 
iiberleben und sich vermehren, die im Vergleich geringer adaptive Mutationen und eine weniger hohe Replikationseffi- 
zienz aufweisen. 

Das bisher beschriebene HCV-RNA-Konstrukt 9-1 3F, das mehrere adaptive Mutationen enthielt, hatte eine erwiesener- 

35 maBen hohere Replikationseffizienz als die parentale HCV-RNA. Urn HCV-RNAs mit noch hoherer Replikation in Zell- 
kultur zu erhalten, wurde die HCV-RNA, die in der Gesamt-RNA eines ausgewahlten Zellklons enthalten war, mehrfach 
in naiven Huh-7 Zellen passagiert. Dieser ausgewahlte Zellklon, genannt 5-1 5, wurde durch Transfektion mit dem HCV- 
RNA-Konstrukt l 389 /NS3-3' erhalten (Fig. 1). Er entspricht weitgehend dem Zellklon 9-13, der durch Transfektion mit 
einem HCV-RNA-Konstrukt hergestellt wurde, das eine urn 22 Nukleotide kurzere HCV-IRES besaB (l 377 /NS3-3'; Fig. 

40 1). 10 Mikrogramm Gesamt-RNA, isoliert aus dem Zellklon 5-15, wurden mittels Elektroporation in naiive Huh-7 Zellen 
eingeschleust und die Zellen einer Selektion mit 1 mg/ml G418 unterzogen. Aus einem der so erzeugten Zellklone 
wurde wiederum Gesamt-RNA isoliert, in naive Huh-7 Zellen transfiziert und analog selektioniert. Dieser Vorgang 
wurde insgesamt viermal wiederholt. Nach der vierten Passage wurde aus einem Zellklon die Gesamt-RNA isoliert und 
die neo-HCV-RNA mit Hilfe der 'long-distance RT-PCR' amplif iziert. Das amplif izierte DNA-Fragment wurde mit dem 

45 Restriktionsenzym Sf il verdaut und in das Sfil-restringierte Ausgangskonstrukt l 389 /NS3-3' inseriert. Insgesamt wurden 
uber 100 DNA-Klone erhalten und zunachst mittels Restriktionsverdau analysiert. In vitro transkribierte RNA von ca. 80 
dieser Klone wurde jeweils in naive Huh-7 eingeschleust und einer Selektion mit 500mg/ml G418 unterzogen. Von den 
80 untersuchten neo-HCV-RNA- Varianten erwiesen sich die allermeisten als replikationsdefekt. Bei zwei Mutanten, 
genannt 5.1 und 19, war die spezifische Infektiositat, ausgedriickt als 'colony forming units' pro Mikrogramm RNA, 

50 jedoch sehr deutlich erhoht (Tabelle 2). Durch mehrfache Passage der RNA in Zellkultur lassen sich offensichtlich HCV- 
RNAs herstellen, deren Replikationseffizienz aufgrund von Mutationen (sog. "adaptiven Mutationen) mehrere GroBen- 
ordnungen hoher ist als die der urspriinglich aus dem Patienten klonierten RNA. 

(B) Modif ikationsverfahren 

55 

[0081] Solche nach (A) erzeugtenn und identifizierten adaptiven Mutationen konnen in ein wenig replikationskom- 
petentes HCV-RNA-Konstrukt ubertragen werden und fuhren zu einer massiven Steigerung der Replikation dieses 
Konstrukts. Diese Steigerung ist so hoch, daB damit nachweislich HCV-RNAs in Zellkultur zur Replikation gebracht 
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werden konnen, die kein selektierbares Markergen mehr besitzen. Fig. 12 zeigt einen Vergleich der Replikationseffizi- 
enz von HCV-RNAs, die entweder der Ausgangssequenz oder den adaptierten Sequenzen 9-13F bzw. 5.1 entspra- 
chen. Zwecks einfacher Messung wurde das neo-Gen entfernt und durch das Gen fur die Luziferase ersetzt. Als 
Negativkontrolle diente wiederum ein HCV-RNA-Konstrukt, das auf Grund einer inaktivierenden Mutation der NS5B 

5 RNA-Polymerase replikationsdefekt war. Schon 24 Stunden nach der Transfektion erkennt man einen deutlichen Unter- 
schied in der Luziferaseaktivitat zwischen der defekten RNA und den 9-13F bzw. 5.1-Konstrukten wahrend zwischen 
der defekten RNA (318 DN) und dem Ausgangs-RNA-Konstrukt (wt) das keine adaptiven Mutationen besaB, kaum ein 
Unterschied zu sehen war. Wahrend des gesamten Beobachtungszeitraums wurde die hochste Luziferaseaktivitat und 
damit die hochste Replikation mit der 5.1 -RNA erhalten. Diese Befunde belegen nicht nur die hohe Replikationseffizi- 

10 enz dieser RNA, sondern zeigen auch, daB es moglich ist, mit adaptierten HCV-RNA-Konstrukten ein Zellkultursystem 
aufzubauen, fur das die Anwesenheit eines selektierbaren Gens nicht mehr notwendig ist. Eine zusammenfassende 
Ubersicht der Nukleotid- und Aminosaureunterschiede zwischen dem Ausgangskonstrukt und den Mutanten 9-1 3F, 5.1 
und 19 ist in Tabelle 3 gegeben. 

15 Beispiel 8: Herstellung zellkultur-adaptierter HCV-RNA-Vollangengenome 

[0082] In den Beispielen 1 bis 7 wurde stets eine subgenomische HCV-RNA verwendet, der die gesamte Struktur- 
proteinregion von Core bis einschlieBlich p7 bzw. NS2 fehlte. Im vorliegenden Beispiel 8 wird gezeigt, daB es moglich 
ist, mit Hilfe der adaptierten NS3-5B-Sequenz ein HCV-Vollangengenom in Zellkultur zur Replikation zu bringen. Zu 

20 diesem Zweck wurde zunachst das Sf il-Fragment der gemaB Beispiel 7 hergestellten, hoch adaptierten HCV-RNA 5.1 
in ein selektionierbares HCV-Vollangengenom transferiert (Fig. 12). Dieses HCV-Genom wurde in naive Huh-7 Zellen 
transfiziert und einer Selektion mit unterschiedlichen G418-Konzentrationen unterzogen. In Abhangigkeit von der 
Selektionsstarke (der G418-Konzentration) wurde eine unterschiedlich groBe Zahl an Zellklonen erhalten (Fig. 12 B) . 
Im Vergleich dazu wurden mit dem unveranderten HCV-Vollangengenom, das keine-adaptiven Mutationen enthielt, 

25 keine Kolonien erhalten, ebenso mit der Negativkontrolle, die auf Grund einer inaktivierenden Mutation in der NS5B 
RNA-Polymerase replikationsdefekt war. Zum Nachweis dafur, daB die so entstandenen Zellklone tatsachlich ein auto- 
nom replizierendes HCV-Vollangenkonstrukt enthielten, wurde Gesamt-RNA aus mehreren Zellklonen isoliert und mit- 
tels Northern-Blot analysiert. In alien Zellklonen war die Vollangen HCV-RNA eindeutig nachweisbar (Fig. 12). Damit ist 
eindeutig belegt, daB es mit Hilfe der an Zellkulturen adaptierten HCV-Sequenzen moglich ist, ein HCV-Vollangenge- 

30 nom herzustellen, das mit hoher Effizienz und autonom in einer Zellinie repliziert, d.h. es konnen mit dem erfindungs- 
gemaBen System auch adaptierte HCV-Vollangengenome hergestellt werden. Da dieser Klon daruber hinaus die 
vollstandige HCV-Sequenz besitzt, also auch die fur die Viruspartikelbildung notwendigen Stru ktur protein e, ist es mit 
diesem System moglich, groBe Mengen infektioser Viruspartikel in Zellkulturen herzustellen. Zum Nachweis dieser 
Viren werden zellfreie Uberstande von Zellen, die ein replizierendes HCV-Vollangengenom tragen, auf naive Huh-7 Zel- 

35 len gegeben und die so infizierten Zellen einer Selektion mit G41 8 unterzogen. Jeder Zellklon, der unter diesen Bedin- 
gungen auswachst, geht auf eine infizierte Zelle zuriick. Die Viren in den Zellkulturuberstanden von Zellen, die ein 
replizierendes HCV-Vollangengenom besitzen, konnen aber auch mit verschiedenen im Stand der Technik bekannten 
Verfahren wie Ultrazentrifugation oder Mikrodialyse angereichert und gereinigt werden und dann zur Infektion naiver 
Zellen verwendet werden. Mit diesem Verfahren ist eindeutig gezeigt, daB mit dem erf indungsgemaBen HCV-Zellkultur- 

40 system zellkultur-adaptierte HCV-Vollangengenome hergestellt werden konnen, die mit hoher Effizienz in Zellen repli- 
zieren und infektiose Viren produzieren. Diese konnen ebenfalls durch Infektion eines Versuchstiers, vorzugsweise 
dem Schimpansen, nachgewiesen werden. 

Beispiel 9: Herstellung von HC V- Vollangen- Konstrukten und HCV-Subgenom-Konstrukten mit Reportergen. 

45 

[0083] Es wird ein HCV-RNA-Konstrukt hergestellt, bei dem anstelle des Antibiotikumresistenzgens ein Reporter- 
gen eingefugt wird (Fig. 13). Dabei kann die Replikation anhand der Menge bzw. der Aktivitat des Reportergens bzw. 
Reportergenprodukts bestimmt werden. Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luziferase- 
gene, dem CAT-Gen (Chloramphenicol-Acetyl-Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), dem GFP- 

so Gen (green fluorescence protein Gen), dem GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (sezernierte alkali- 
sche Phosphatasegen). Diese Reportergene bzw. deren Produkte, namlich die entsprechenden Reporterproteine, kon- 
nen z.B. mittels Fluoreszenz, Chemilumineszenz, colorimetrisch oder mit Hilfe immunologischer Methoden (z.B. 
enzyme-linked immunosorbent assay, ELISA) bestimmt werden. Das Reportergen kann entweder von einer eigenen 
IRES exprimiert werden oder in Form eines Fusionsproteins, das entweder als solches aktiv ist oder mittels einer pro- 

55 teolytisch spaltbaren Aminosauresequenz so mit einem HCV-Protein verbunden ist, daB es von einer zellularen oder 
viralen (HCV-)Protease von diesem abgespalten wird. 
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Beispiel 10 : Herstellung von HCV-Vollangen-Konstrukten mit integrierten Fremdgenen zur Verwendung als 
leberzellspezif ische Genfahre fur die Gentherapie Oder als Expressionsvektor 

[0084] Das Konstrukt (Fig. 14) wird in Zellen eingeschleust und fiihrt dort zur Bildung von HCV-Viruspartikeln, die 
5 zur Infektion weiterer Zellen verwendet werden konnen. Da die Viruspartikel eine RNA mit einem Fremdgen enkapsi- 
diert haben kann dieses in den so infizierten Zellen zur Produktion des von diesem Fremdgen kodierten Proteins 
benutzt werden. Zellen, die mit dem Konstrukt transf iziert wurden, exprimieren ebenfalls das Fremdgen. 

Beispiel 11 : Herstellung von monocistronischen HCV-RNA-Konstrukten, bei denen das Resistenzgenprodukt 
10 als Fusionsprotein mit dem HCV-Anteil exprimiert wird. 

[0085] Fur bestimmte Untersuchungen ist es von Vorteil, wenn das HCV-RNA-Konstrukt kein heterologes IRES- 
Element besitzt. Solche Untersuchungen sind beispielsweise die Bestimmung der Interferonresistenz. Wird eine Zelle, 
die ein HCV-RNA-Konstrukt besitzt, mit Interferon-alpha Oder -beta inkubiert, kommt es zu einer Reduktion der Repli- 

15 kation der HCV-RNA. Zur Aufklarung des Wirkungsmechanismus ist es notwendig, daB das HCV-RNA-Konstrukt keine 
heterologe IRES besitzt, da ansonsten nicht bestimmt werden kann, ob die Interferon -vermittelte Hemmung durch eine 
Hemmung der HCV-Replikation oder durch eine Hemmung der heterologen IRES vermittelt wird. Deshalb werden Kon- 
strukte hergestellt, bei denen das Resistenzgen mit einem HCV-Proteinfusioniert wird (Fig. 15). Entwederdas Fusions- 
protein ist als solches aktiv oder das Resistenzgenprodukt wird mittels einer proteolytisch spaltbaren 

20 Aminosauresequenz so mit einem HCV-Protein verbunden ist, daB es von einer zellularen oder viralen (HCV-) Protease 
von diesem abgespalten wird. 



Tabelle 1 



Spezif ische Infektiositaten (cfu/ug RNA) der HCV-RNA-Konstrukte mit adaptiven Mutationen, die bei der 9-1 3F 
Mutante gefunden und in das parentale HCV-RNA-Konstrukt l 38 9/NS3-3'/wt eingefuhrt wurden 


Aminosaureaustausch 1 


HCV-Protein 


cfu/ug RNA 2 


kein 




30 - 60 


1283 arg -> gly 


NS3 


200 - 250 


1383 glu -> ala 


NS3 


30-60 


1577 lys ->arg 


NS3 


30-60 


1609 lys ->glu 


NS3 


160 -300 


(1283 arg -> gly + 1383 glu -> ala + 1577 lys -> arg + 1609 lys - 

> g'u) 


NS3 


360 - 420 1 


1936 pro -> ser 


NS4B 


500 - 1000 


2163 glu -> gly 


NS5A 


1000-5000 


2330 lys -> glu 


NS5A 


30-60 


2442 ile -> val 


NS5B 


30-60 


alle zusammen 




5000 ! 



1 Aminosaureaustausch im Polyprotein des HCV-lsolats Con-1 (EMBL-Genbank No. AJ238799); die Aminosauren sind im 
Dreibuchstabenkode angegeben. 

2 Colony forming units (Anzahl der Zellklone) bei einer Selektion von 500pig/ml G418. 
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Tabelle 2 



Spezifische Infektiositaten (cfu/ug RNA) des parenta- 
len HCV-RNA-Konstrukts l 389 /NS3-3Ywt und der Vari- 
anten 9-13C, 9-131, 9-13F, 5.1 und 19. 


Transfizierte RNA-Vari- 
ante 


cfu/ug RNA 1 ■ 


Wildtyp 


30-50 ] 


9-13 C 


100- 1.000 


9-13 I 


100- 1.000 


9-13 F 


1.000- 10.000 


5.1 


50.000 - 100.000 


19 


50.000 - 100.000 



1 Colony forming units (Anzahl der Zellklone) bei einer 
Selektion von 500^ig/ml G41 8. 
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Tabclle3: NukJeotid- und Aminos&ureunterschiede zwischen dem parentalen HCV- 
RNA-Konstrukt WNS3-3'/wt und den Mutanten 9-131, 9-13F, 5.1 und 19 



HCV Mutante 


Nukleotidposition 


Nukleotidaustausch 


Aminosaureaustausc 
h 


9-131 


3685 


OT 


Pro > Leu 




4933 


C>T 


Thr >Met 




5249 


T>C 






8486 


OT 


_ 




8821 


G> A 


Tip > stop 




8991 


OG 


Arg > Gly 




9203 


A>G 






9313 


T>C 


Phe > Ser 




9346 


T>C 


Val> Ala 


9-13 F 


3866 


C>T 






4188 


A>G 


Arg > Gly 




4489 


A>C 


Glu > Ala 




4562 


G> A 






4983 


T>C 






5071 


A> G 


Lys > Arg 




5166 


A>G 


Lys > Glu 1 




6147 


C>T 


Pro > Ser 




6829 


A>G 


Glu > Gly 




7329 


A>G 


Lys > Glu 




7664 


A> G 


He > Val 




8486 


OT 






8991 


C>G 


Arg > Gly 


NK5.1 


4180 


C>T 


Thr > He 




4679 


OT 
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4682 


T > C 






5610 


C > A 


Leu > He 




5437 


A > Cj 






6666 


A > Cj 


Asn > Asp 




6842 


t* 






6926 


^ T 

L > 1 






6930 


TT rf" 1 
1 > L 


JSer > rro 




/320 


V» T 


Pro > Ser 




7389 


A > Cj 


Lys > Criu 


NK19 


3946 


A> G 


Glu > Gly 




4A10 

4078 


f» v. 
C > Cj 


Ala > Gly 




/1 1 OA 

4180 




1 nr > lie 




4682 


•T l™* 






5610 


C > A 


Leu > He 




5958 


A > 1 


Met > Leu 




6170 


T > A 






6596 


Cj > A 






6598 


L > Cj 


Ala > Criy 




6833 








6842 


^ T* 
L > 1 








t ■> r* 


oer * rrO 




7141 


A > G 


Glu > Gly 




7320 


C>T 


Pro > Ser 




7389 


A > G 


Lys > Glu 




7735 


G> A 


Ser > Asn 



[0086] Angegeben sind die Unterschiede der Nukleotid- und Aminosauresequenzen zwischen der Ausgangs-HCV- 
RNA-Sequenz Con 1 (EMBL-Genbank No. AJ238799) und denen der zellkulturadaptierten HCV-RNAs. Die Zahlen 
beziehen sich auf die Nukleotid- und Aminosaurepositionen des HCV-lsolats Con1. 
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SEQUENCE LISTING 

<110> Bartenschlager, Ralf 

<120> Hepatitis C Virus cell culture system 

<130> ba-1 

<140> 199 15 178.4 
<141> 1999-04-03 

<160> 11 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 



<400> 1 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

caqaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

cgccgcccac 

ttgccgcgca 

caacctcgtg 

gctcagcccg 

ctcctgtcac 

cgcaatttgg 

attccgctcg 

gttctggagg 

ttccttttgg 

gtatccggag 

gcggacatga 

cgctgctggg 

acgatacgac 

gtgggagatc 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatgggcac 
aggacgtcaa 
ggggccccag 
gaaggcgaca 
ggtacccctg 
cccgtggctc 
gtaaggtcat 
tcggcgcccc 
acggcgtgaa 
ctttgctgtc 
tgtaccatgt 
tcatgcatac 
tagcgctcac 
gccatgtcga 
tctgcggatc 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
gaatcctaaa 
gttcccgggc 
gttgggtgtg 
acctatcccc 
gcccetctat 
tcggcctagt 
cgataccctc 
cctagggggc 
ctatgcaaca 
ctgtttgacc 
cacgaacgac 
ccccgggtgc 
tcccacgctc 
tttgctcgtt 
tgttttcctc 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accacgggga 
cctcaaagaa 
ggtggtcaga 
cgcgcgacta 
aaggctcgcc 
ggcaatgagg 
tggggcccca 
acgtgcggct 
gctgccaggg 
gggaatctgc 
atcccagctt 
tgctccaacg 
gtgccctgcg 
gcggccagga 
ggggcggctg 
gtcgcccagc 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
aaaccaaacg 
tcgtcggtgg 
ggaagacttc 
agcccgaggg 
gcttggggtg 
cggacccccg 
tcgccgatct 
ccctggcgca 
ccggttgctc 
ccgcttatga 
caagcattgt 
ttcgggagaa 
acgctagcgt 
ctctctgctc 
tgttcacctt 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gcgcggctat 
actgaagcgg 
tctcaccttg 
acgcttgatc 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
acccgtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
taacaccaac 
agtttacctg 
cgagcggtcg 
tagggcctgg 
ggcaggatgg 
gcgtaggtcg 
catggggtac 
tggcgtccgg 
cttttctatc 
agtgcgcaac 
gtatgaggca 
caactcctcc 
ccccactacg 
cgctatgtac 
ctcgcctcgc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 
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cggcacgaga 
cgtatggctt 
ttactccgga 
gcgggccttg 
ctctttgccg 
ctcgggatta 
aacggcagct 
ttccttgctg 
gccagctgca 
tcacacagct 
gtacccgcgg 
gggacgaccg 
ctgcttctta 
agcactgggt 
aaaaccttga 
tgtggttcgg 
cactacccct 
gagcacaggc 
agggacagat 
tgttccttca 
gtggacgtac 
gagtatgtcc 
atgatgctgc 
gcatccgtgg 
tacatcaagg 
ctcctgctcc 
tcgtgcggag 
ctgttcctcg 
ttgcaagtgt 
acgtgcgcga 
ggtccactca 
gggctcattc 
gctctcatga 
cgggactggg 
tctgatatgg 
atcttgggcc 
agccttgaag 
cgaggcctac 
ggggaggtcc 
gtgtgttgga 
atcacccaaa 
gcgcgttcct 
gccgatgtca 
cccgtctcct 
gtgggcatct 
cccgtcgagt 
ccggccgtac 
agcactaagg 
tccgtcgccg 
aacatcagaa 
ggcaagtttc 
gagtgccact 
gagacggctg 
gtgccacatc 
ggcaaagcca 
aagaagaaat 
tattaccggg 
acggacgctc 
tgtgtcaccc 
gtgccacaag 
ggcatttaca 
ctgtgcgagt 
gttaggttgc 
ttctgggaga 
aagcaggcag 
gctcaggctc 



cagtacagga 
gggatatgat 
tcccacaagc 
cctactattc 
gcgttgacgg 
cgtccctctt 
ggcacatcaa 
cgctgttcta 
gccccatcga 
cggaccagag 
cgcaggtgtg 
accggttcgg 
acaacacgcg 
tcaccaagac 
cctgccccac 
ggccttggtt 
gcactgtcaa 
tcgaagccgc 
cagagcttag 
ccaccctacc 
aatacctgta 
tgttgctctt 
tgatagctca 
ccggggcgca 
gcaggctggt 
tgctggcgtt 
gcgcggtttt 
ctaggctcat 
ggatcccccc 
tccacccaga 
tggtgctcca 
gtgcatgcat 
agttggccgc 
cccacgcggg 
agaccaaggt 
tgcccgtctc 
ggcaggggtg 
ttggctgcat 
aagtggtctc 
ctgtctatca 
tgtacaccaa 
tgacaccatg 
ttccggtgcg 
acttgaaggg 
ttcgggctgc 
ctatggaaac 
cgcagacatt 
tgccggctgc 
ccaccctagg 
ccggggtaag 
ttgccgacgg 
caactgactc 
gagcgcgact 
caaacatcga 
tccccatcga 
gtgatgagct 
gccttgatgt 
taa.tgacggg 
agacagtcga 
acgcggtgtc 
ggtttgtgac 
gctatgacgc 
gggcttacct 
gcgtctttac 
gagacaactt 
cacctccatc 



ctgcaattgc 
gatgaactgg 
tgtcgtggat 
catggtgggg 
gggaacctat 
ttcacccggg 
caggactgcc 
cgtgcacaag 
cgcgttcgct 
gccttattgt 
tggtccagtg 
cgtccctacg 
gccgccgcaa 
gtgcgggggc 
ggactgcttc 
gacacccaga 
ctttaccatc 
atgcaattgg 
cccgctgctg 
ggctctgtcc 
cggtataggg 
ccttcttctg 
agctgaggcc 
tggcattctc 
ccctggggcg 
accaccacga 
cgtaggtctg 
atggtggtta 
cctcaacgtt 
gctaatcttt 
ggctggtata 
gctggtgcgg 
actgacaggt 
cctacgagac 
tatcacctgg 
cgcccgcagg 
gcgactcctc 
catcactagc 
caccgcaaca 
tggtgccggc 
tgtggaccag 
cacctgcggc 
ccggcggggc 
ctcttcgggc 
cgtgtgcacc 
cactatgcgg 
ccaggtggcc 
gtatgcagcc 
tttcggggcg 
gaccatcacc 
tggttgctct 
gaccactatc 
cgtcgtgctc 
ggaggtggct 
gaccatcaag 
cgccgcgaag 
atccgtcata 
ctttaccggc 
cttcagcctg 
acgctcgcag 
tccaggagaa 
gggctgtgct 
aaacacacca 
aggcctcacc 
cccctacctg 
gtgggaccaa 



tcaatatatc 
tcacctacag 
atggtggcgg 
aactgggcta 
gtgacagggg 
tcatcccaga 
ctgaactgca 
ttcaactcat 
caggggtggg 
tggcactacg 
tactgcttca 
tacagttggg 
ggcaactggt 
cccccgtgta 
cggaagcacc 
tgcttggtcc 
ttcaaggtta 
actcgaggag 
ctgtctacaa 
actggtttga 
tcggcggttg 
gcggacgcgc 
gccctagaga 
tccttcctcg 
gcatatgccc 
gcatacgcca 
atactcttga 
caatatttta 
cgggggggcc 
accatcacca 
accaaagtgc 
aaggttgctg 
acgtacgttt 
cttgcggtgg 
ggggcagaca 
gggagggaga 
gcgcctatta 
ctcacaggcc 
caatctttcc 
tcaaagaccc 
gacctcgtcg 
agctcggacc 
gacagcaggg 
ggtccactgc 
cgaggggttg 
tccccggtct 
catctacacg 
caagggtata 
tatatgtcta 
acgggtgccc 
gggggcgcct 
ctgggcatcg 
gccaccgcta 
ctgtccagca 
ggggggaggc 
ctgtccggcc 
ccaactagcg 
gatttcgact 
gacccgacct 
cggcgaggca 
cggccctcgg 
tggtacgagc 
gggttgcccg 
cacatagacg 
gtagcatacc 
atgtggaagt 



ccggccacgt 
cagccctagt 
gggcccattg 
aggttctgat 
ggacgatggc 
aaatccagct 
atgactccct 
ctggatgccc 
ggcccatcac 
caccccggcc 
ccccaagccc 
gggagaatga 
ttggctgtac 
acatcggggg 
ccgaggccac 
actacccata 
ggatgtacgt 
agcgttgtaa 
cggagtggca 
tccatctcca 
tctcctttgc 
gcgtctgtgc 
acctggtggt 
tgttcttctg 
tctacggcgt 
tggaccggga 
ccttgtcacc 
tcaccagggc 
gcgatgccgt 
aaatcttgct 
cgtacttcgt 
ggggtcatta 
atgaccatct 
cagttgagcc 
ccgcggcgtg 
tacatctggg 
cggcctactc 
gggacaggaa 
tggcgacctg 
ttgccggccc 
gctggcaagc 
tttacttggt 
ggagcctact 
tctgcccctc 
cgaaggcggt 
tcacggacaa 
cccctactgg 
aggtgcttgt 
aggcacatgg 
ccatcacgta 
atgacatcat 
gcacagtcct 
cgcctccggg 
ctggagaaat 
acctcatttt 
tcggactcaa 
gagacgtcat 
cagtgatcga 
tcaccattga 
ggactggtag 
gcatgttcga 
tcacgcccgc 
tctgccagga 
cccatttctt 
aggctacggt 
gtctcatacg 



gacaggtcac 
ggtatcgcag 
gggagtccta 
tgtgatgcta 
caaaaacacc 
tgtaaacacc 
caacactggg 
agagcgcatg 
ttacaatgag 
gtgcggtatc 
tgtcgtggtg 
gacggacgtg 
atggatgaat 
gatcggcaat 
ttacaccaag 
caggctttgg 
ggggggagtg 
cctggaggac 
ggtattgccc 
tcagaacgtc 
aatcaaatgg 
ctgcttgtgg 
cctcaacgcg 
tgctgcctgg 
atggccgcta 
gatggcagca 
gcactataag 
cgaggcacac 
catcctcctc 
cgccatactc 
gcgcgcacac 
tgtccaaatg 
caccccactg 
cgtcgtcttc 
tggggacatc 
accggcagac 
ccaacagacg 
ccaggtcgag 
cgtcaatggc 
aaagggccca 
gccccccggg 
cacgaggcat 
ctcccccagg 
ggggcacgct 
ggactttgta 
ctcgtcccct 
tagcggcaag 
cctgaacccg 
tatcgaccct 
ctccacctat 
aatatgtgat 
ggaccaagcg 
atcggtcacc 
ccccttttat 
ctgccattcc 
tgctgtagca 
tgtcgtagca 
ctgcaataca 
gacgacgacc 
gggcaggatg 
ttcctcggtt 
cgagacctca 
cca tctggag 
gtcccagact 
gtgcgccagg 
gctaaagcct 



2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
57 60 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
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acgctgcacg 
accacacacc 
acgagcacct 
acaggcagcg 
gacagggaag 
tacatcgaac 
caaacagcca 
ctcgaagcct 
ggcttgtcca 
atcaccagcc 
gccgcccaac 
gcggctgttg 
gcaggggtgg 
gaggacctgg 
gtgtgcgcag 
aaccggctga 
gagagcgacg 
ctgaagaggc 
ctaagagatg 
tccaagctcc 
ggagtctggc 
ggacatgtga 
catggaacat 
aattattcta 
ggggatttcc 
ccggcccccg 
tgcaaacccc 
gggtcacagc 
gacccctccc 
tccttggcca 
acccgtcatg 
atgggcggga 
gagccgctcc 
aggtccagga 
ctgttagagt 
ccgcctgcca 
gaatctaccg 
tcgtcggccg 
gacgcgggat 
gatcccgatc 
gtctgctgct 
gaaaccaagc 
tatgctacaa 
caggtcctgg 
gttaaggcta 
agatctaaat 
cacatccgct 
atcatggcaa 
cgccttatcg 
gtggtctcca 
ggacagcggg 
gcatatgaca 
tcaatctacc 
gagcggcttt 
cggtgccgcg 
aaggccgctg 
gacgaccttg 
gccttcacgg 
tacgacttgg 
ggcaaaaggg 
gagacagcta 
accttgtggg 
caacttgaaa 
gacctacctc 
tctccaggtg 
cgagtctgga 



ggccaacgcc 
ccataaccaa 
gggtgctggt 
tggtcattgt 
tcctttaccg 
agggaatgca 
ccaagcaagc 
tctgggcgaa 
ctctgcctgg 
cgctcaccac 
ttgctcctcc 
gcagcatagg 
caggcgcgct 
ttaacctact 
cgatactgcg 
tagcgttcgc 
ctgcagcacg 
ttcaccagtg 
tttgggattg 
tgccgcgatt 
ggggcgacgg 
aaaacggttc 
tccccattaa 
gggcgctgtg 
actacgtgac 
aattcttcac 
tcctacggga 
tcccatgcga 
acattacggc 
gctcatcagc 
actccccgga 
acatcacccg 
aagcggagga 
aattccctcg 
cctggaagga 
aggcccctcc 
tgtcttctgc 
tcgacagcgg 
ccgacgttga 
tcagcgacgg 
cgatgtccta 
tgcccatcaa 
catctcgcag 
acgaccacta 
aacttctatc 
ttggctatgg 
ccgtgtggaa 
aaaatgaggt 
tattcccaga 
ccctccctca 
tcgagttcct 
cccgctgttt 
aatgttgtga 
acatcggggg 
cgagcggtgt 
cggcctgtcg 
tcgttatctg 
aggctatgac 
agttgataac 
tgtactatct 
gacacactcc 
caaggatgat 
aagccctaga 
agatcattca 
agatcaatag 
gacatcgggc 



cctgctgtat 
atacatcatg 
aggcggagtc 
gggcaggatc 
ggagttcgat 
gctcgccgaa 
ggaggctgct 
gcatatgtgg 
caaccccgcg 
ccaacatacc 
cagcgctgct 
ccttgggaag 
cgtggccttt 
ccctgctatc 
tcggcacgtg 
ttcgcggggt 
tgtcactcag 
gatcaacgag 
gatatgcacg 
gccgggagtc 
catcatgcaa 
catgaggatc 
cgcgtacacc 
gcgggtggct 
gggcatgacc 
agaagtggat 
ggaggtcaca 
gcccgaaccg 
ggagacggct 
tagccagctg 
cgctgacctc 
cgtggagtca 
ggatgagagg 
agcgatgccc 
cccggactac 
gataccacct 
cttggcggag 
cacggcaacg 
gtcgtactcc 
gtcttggtct 
cacatggaca 
tgcactgagc 
cgcaagcctg 
ccgggacgtg 
cgtggaggaa 
ggcaaaggac 
ggacttgctg 
tttctgcgtc 
tttgggggtt 
ggccgtgatg 
ggtgaatgcc 
tgactcaacg 
cttggccccc 
ccccctgact 
actgacgacc 
agctgcgaag 
tgaaagcgcg 
tagatactct 
atcatgctcc 
cacccgtgac 
agtcaattcc 
cctgatgact 
ttgtcagatc 
acgactccat 
ggtggcttca 
cagaagtgtc 



aggctgggag 
gcatgcatgt 
ctagcagctc 
atcttgtccg 
gagatggaag 
caattcaaac 
gctcccgtgg 
aatttcatca 
atagcatcac 
ctcctgttta 
tctgctttcg 
gtgcttgtgg 
aaggtcatga 
ctctcccctg 
ggcccagggg 
aaccacgtct 
atcctctcta 
gactgctcca 
gtgttgactg 
cccttcttct 
accacctgcc 
gtggggccta 
acgggcccct 
gctgaggagt 
actgacaacg 
ggggtgcggt 
ttcctggtcg 
gacgtagcag 
aagcgtaggc 
tctgcgcctt 
atcgaggcca 
gaaaataagg 
gaagtatccg 
atatgggcac 
gtccctccag 
ccacggagga 
ctcgccacaa 
gcctctcctg 
tccatgcccc 
accgtaagcg 
ggcgccctga 
aactctttgc 
cggcagaaga 
ctcaaggaga 
gcctgtaagc 
gtccggaacc 
gaagacactg 
caaccagaga 
cgtgtgtgcg 
ggctcttcat 
tggaaagcga 
gtcactgaga 
gaagccagac 
aattctaaag 
agctgcggta 
ctccaggact 
gggacccaag 
gccccccctg 
tccaatgtgt 
cccaccaccc 
tggctaggca 
catttcttct 
tacggggcct 
ggccttagcg 
tgcctcagga 
cgcgctaggc 



ccgttcaaaa 
cggctgacct 
tggccgcgta 
gaaagccggc 
agtgcgcctc 
agaaggcaat 
tggaatccaa 
gcgggataca 
tga tggcatt 
acatcctggg 
taggcgccgg 
atattttggc 
gcggcgagat 
gcgccctagt 
agggggctgt 
cccccacgca 
.gtcttaccat 
cgccatgctc 
atttcaagac 
catgtcaacg 
catgtggagc 
ggacctgtag 
gcacgccctc 
acgtggaggt 
taaagtgccc 
tgcacaggta 
ggctcaatca 
tgctcacttc 
tggccagggg 
ccttgaaggc 
acctcctgtg 
tagtaatttt 
ttccggcgga 
gcccggatta 
tggtacacgg 
agaggacggt 
agaccttcgg 
accagccctc 
cccttgaggg 
aggaggctag 
tcacgccatg 
tccgtcacca 
aggtcacctt 
tgaaggcgaa 
tgacgccccc 
tatccagcaa 
agacaccaat 
aggggggccg 
agaaaatggc 
acggattcca 
agaaatgccc 
atgacatccg 
aggccataag 
ggcagaactg 
ataccctcac 
gcacgatgct 
aggacgaggc 
gggacccgcc 
cagtcgcgca 
cccttgcgcg 
acatcatcat 
ccatccttct 
gttactccat 
cattttcact 
aacttggggt 
tactgtccca 



cgaggttact 
ggaggtcgtc 
ttgcctgaca 
catcattccc 
acacctccct 
cgggttgctg 
gtggcggacc 
atatttagca 
cacagcctct 
gggatgggtg 
catcgctgga 
aggttatgga 
gccctccacc 
cgtcggggtc 
gcagtggatg 
ctatgtgcct 
cactcagctg 
cggctcgtgg 
ctggctccag 
tgggtacaag 
acagatcacc 
taacacgtgg 
cccggcgcca 
tacgcgggtg 
gtgtcaggtt 
cgctccagcg 
atacctggtt 
catgctcacc 
atctcccccc 
aacatgcact 
gcggcaggag 
ggactctttc 
gatcctgcgg 
caaccctcca 
gtgtccattg 
tgtcctgtca 
cagctccgaa 
cgacgacggc 
ggagccgggg 
tgaggacgtc 
cgctgcggag 
caacttggtc 
tgacagactg 
ggcgtccaca 
acattcggcc 
ggccgttaac 
tgacaccacc 
caagccagct 
cctttacgat 
atactctcct 
tatgggcttc 
tgttgaggag 
gtcgctcaca 
cggctatcgc 
atgttacttg 
cgtatgcgga 
gagcctacgg 
caaaccagaa 
cgatgcatct 
qgctgcgtgg 
gtatgcgccc 
agctcaggaa 
tgagccactt 
ccatagttac 
accgcccttg 
gggggggagg 



6720 

6780 

6840 

6900 

6960 

7020 

7080 

7140 

7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 

8520 

8580 

8640 

8700 

8760 

8820 

8880 

8940 

9000 

9060 

9120 

9180 

9240 

9300 

9360 

9420 

9480 

9540 

9600 

9660 

9720 

9780 

9840 

9900 

9960 

10020 

10080 

10140 

10200 

10260 

10320 

10380 

10440 

10500 

10560 

10620 
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gctgccactt gtggcaagta cctcttcaac tgggcagtaa ggaccaagct caaactcact 10680 

ccaatcccgg ctgcgtccca gttggattta tccagctggt tcgttgctgg ttacagcggg 107 40 

ggagacatat atcacagcct gtctcgtgcc cgaccccgct ggttcatgtg gtgcctactc 10800 

ctactttctg taggggtagg catctatcta ctccccaacc gatgaacggg gagctaaaca 10860 

ctccaggcca ataggccatc ctgttttttt cccttttttt ttttcttttt tttttttttt 10920 

tttttttttt tttttttttc tccttttttt ttcctctttt tttccttttc tttcctttgg 10980 

tggctccatc ttagccctag tcacggctag ctgtgaaagg tccgtgagcc gcttgactgc 11040 

agagagtgct gatactggcc tctctgcaga tcaagt 11076 
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<210> 2 
<211> 8637 
<212> DNA 

<213> Hepatitis C Virus 



<400> 2 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

cggccgcttg 

ctgatgccgc 

acctgtccgg 

cgacgggcgt 

tgctattggg 

aagtatccat 

cattcgacca 

ttgtcgatca 

ccaggctcaa 

gcttgccgaa 

tgggtgtggc 

ttggcggcga 

agcgcatcgc 

gtttccctct 

cgaagccgct 

ccgtcttttg 

aggggtcttt 

gttcctctgg 

aaccccccac 

gcaaaggcgg 

tggctctcct 

atgggatctg 

aacgtctagg 

atggaccggg 

accttgtcac 

atcaccaggg 

cgcgatgccg 

aaaatcttgc 

ccgtacttcg 

gggggtcatt 

tatgaccatc 

gcagttgagc 

accgcggcgt 

atacatctgg 

acggcctact 

cgggacagga 

ctggcgacct 

cttgccggcc 

ggctggcaag 

ctttacttgg 

gggagcctac 

ctctgcccct 

gcgaaggcgg 

ttcacggaca 

gcccctactg 

aaggtgcttg 

aaggcacatg 

cccatcacgt 

tatgacatca 

ggcacagtcc 

acgcctccgg 

actggagaaa 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaaggg 
ggtggagagg 
cgtgttccgg 
tgccctgaat 
tccttgcgca 
cgaagtgccg 
catggctgat 
ccaagcgaaa 
ggatgatctg 
ggcgcgcatg 
tatcatggtg 
ggaccgctat 
atgggctgac 
cttctatcgc 
agcgggatca 
tggaataagg 
gcaatgtgag 
cccctctcgc 
aagcttcttg 
ctggcgacag 
cacaacccca 
caagcgtatt 
atctggggcc 
ccccccgaac 
agatggcagc 
cgcactataa 
ccgaggcaca 
tcatcctcct 
tcgccatact 
tgcgcgcaca 
atgtccaaat 
tcacccca ct 
ccgtcgtctt 
gtggggacat 
gaccggcaga 
cccaacagac 
accaggtcga 
gcgtcaatgg 
caaagggccc 
cgccccccgg 
tcacgaggca 
tctcccccag 
cggggcacgc 
tggactttgt 
actcgtcccc 
gtagcggcaa 
tcctgaaccc 
gtatcgaccc 
actccaccta 
taatatgtga 
tggaccaagc 
gatcggtcac 
tcccctttta 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
cgcgccatga 
ctattcggct 
ctgtcagcgc 
gaactgcagg 
gctgtgctcg 
gggcaggatc 
gcaatgcggc 
catcgcatcg 
gacgaagagc 
cccgacggcg 
gaaaatggcc 
caggacatag 
cgcttcctcg 
cttcttgacg 
attccgcccc 
ccggtgtgcg 
ggcccggaaa 
caaaggaatg 
aagacaaaca 
gtgcctctgc 
gtgccacgtt 
caacaagggg 
tcggtgcaca 
cacggggacg 
atcgtgcgga 
gctgttcctc 
cttgcaagtg 
cacgtgcgcg 
cggtccactc 
cgggctcatt 
ggctctcatg 
gcgggactgg 
ctctgatatg 
catcttgggc 
cagccttgaa 
gcgaggccta 
gggggaggtc 
cgtgtgttgg 
aatcacccaa 
ggcgcgttcc 
tgccgatgtc 
gcccgtctcc 
tgtgggcatc 
acccgtcgag 
tccggccgta 
gagcactaag 
gtccgtcgcc 
taacatcaga 
tggcaagttt 
tgagtgccac 
ggagacggct 
cgtgccacat 
tggcaaagcc 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ttgaacaaga 
atgactgggc 
aggggcgccc 
acgaggcagc 
acgttgtcac 
tcctgtcatc 
ggctgcatac 
agcgagcacg 
atcaggggct 
aggatctcgt 
gcttttctgg 
cgttggctac 
tgctttacgg 
agttcttctg 
tctccctccc 
tttgtctata 
cctggccctg 
caaggtctgt 
acgtctgtag 
ggccaaaagc 
gtgagttgga 
ctgaaggatg 
tgctttacat 
tggttttcct 
ggcgcggttt 
gctaggctca 
tggatccccc 
atccacccag 
atggtgctcc 
cgtgcatgca 
aagttggccg 
gcccacgcgg 
gagaccaagg 
ctgcccgtct 
gggcaggggt 
cttggctgca 
caagtggtct 
actgtctatc 
atgtacacca 
ttgacaccat 
attccggtgc 
tacttgaagg 
tttcgggctg 
tctatggaaa 
ccgcagacat 
gtgccggctg 
gccaccctag 
accggggtaa 
cttgccgacg 
tcaactgact 
ggagcgcgac 
ccaaacatcg 
atccccatcg 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
tggattgcac 
acaacagaca 
ggttcttttt 
gcggctatcg 
tgaagcggga 
tcaccttgct 
gcttgatccg 
tactcggatg 
cgcgccagcc 
cgtgacccat 
attcatcgac 
ccgtgatatt 
tatcgccgct 
agtttaaaca 
ccccccctaa 
tgttattttc 
tcttcttgac 
tgaatgtcgt 
cgaccctttg 
cacgtgtata 
tagttgtgga 
cccagaaggt 
gtgtttagtc 
ttgaaaaaca 
tcgtaggtct 
tatggtggtt 
ccctcaacgt 
agctaatctt 
aggctggtat 
tgctggtgcg 
cactgacagg 
gcctacgaga 
ttatcacctg 
ccgcccgcag 
ggcgactcct 
tcatcactag 
ccaccgcaac 
atggtgccgg 
atgtggacca 
gcacctgcgg 
gccggcgggg 
gctcttcggg 
ccgtgtgcac 
ccactatgcg 
tccaggtggc 
cgtatgcagc 
gtttcggggc 
ggaccatcac 
gtggttgctc 
cgaccactat 
tcgtcgtgct 
aggaggtggc 
agaccatcaa 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gcaggttctc 
atcggctgct 
gtcaagaccg 
tggctggcca 
agggactggc 
cctgccgaga 
gctacctgcc 
gaagccggtc 
gaactgttcg 
ggcgatgcct 
tgtggccggc 
gctgaagagc 
cccgattcgc 
gaccacaacg 
cgttactggc 
caccatattg 
gagcattcct 
gaaggaagca 
caggcagcgg 
agatacacct 
aagagtcaaa 
accccattgt 
gaggttaaaa 
cgataatacc 
gatactcttg 
acaatatttt 
tcgggggggc 
taccatcacc 
aaccaaagtg 
gaaggttgct 
tacgtacgtt 
ccttgcggtg 
gggggcagac 
ggggagggag 
cgcgcctatt 
cctcacaggc 
acaatctttc 
ctcaaagacc 
ggacctcgtc 
cagctcggac 
cgacagcagg 
cggtccactg 
ccgaggggtt 
gtccccggtc 
ccatctacac 
ccaagggtat 
gtatatgtct 
cacgggtgcc 
tgggggcgcc 
cctgggcatc 
cgccaccgct 
tctgtccagc 

gggggggagg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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cacctcattt 
ctcggactca 
ggagacgtca 
tcagtgatcg 
ttcaccattg 
aggactggta 
ggcatgttcg 
ctcacgcccg 
gtctgccagg 
gcccatttct 
caggctacgg 
tgtctcatac 
gccgttcaaa 
tcggctgacc 
ctggccgcgt 
ggaaagccgg 
gagtgcgcct 
cagaaggcaa 
gtggaatcca 
agcgggatac 
ctgatggcat 
aacatcctgg 
gtaggcgccg 
gatattttgg 
agcggcgaga 
ggcgccctag 
gagggggctg 
tcccccacgc 
agtcttacca 
acgccatgct 
gatttcaaga 
tcatgtcaac 
ccatgtggag 
aggacctgta 
tgcacgccct 
tacgtggagg 
gtaaagtgcc 
ttgcacaggt 
gggctcaatc 
gtgctcactt 
ctggccaggg 
tccttgaagg 
aacctcctgt 
gtagtaattt 
gttccggcgg 
cgcccggatt 
gtggtacacg 
aagaggacgg 
aagaccttcg 
gaccagccct 
ccccttgagg 
gaggaggcta 
atcacgccat 
ctccgtcacc 
aaggtcacct 
atgaaggcga 
ctgacgcccc 
otatccagca 
gagacaccaa 
aaggggggcc 
gagaaaatgg 
tacggattcc 
aagaaatgcc 
aatgacatcc 
caggccataa 
gggcagaact 



tctgccattc 
atgctgtagc 
ttgtcgtagc 
actgcaatac 
agacgacgac 
ggggcaggat 
attcctcggt 
ccgagacctc 
accatctgga 
tgtcccagac 
tgtgcgccag 
ggctaaagcc 
acgaggttac 
tggaggtcgt 
attgcctgac 
ccatcattcc 
cacacctccc 
tcgggttgct 
agtggcggac 
aatatttagc 
tcacagcctc 
ggggatgggt 
gcatcgctgg 
caggttatgg 
tgccctccac 
tcgtcggggt 
tgcagtggat 
actatgtgcc 
tcactcagct 
ccggctcgtg 
cctggctcca 
gtgggtacaa 
cacagatcac 
gtaacacgtg 
ccccggcgcc 
ttacgcgggt 
cgtgtcaggt 
acgctccagc 
aatacctggt 
ccatgctcac 
gatctccccc 
caacatgcac 
ggcggcagga 
tggactcttt 
agatcctgcg 
acaaccctcc 
ggtgtccatt 
ttgtcctgtc 
gcagctccga 
ccgacgacgg 
gggagccggg 
gtgaggacgt 
gcgctgcgga 
acaacttggt 
ttgacagact 
aggcgtccac 
cacattcggc 
aggccgttaa 
ttgacaccac 
gcaagccagc 
ccctttacga 
aatactctcc 
ctatgggctt 
gtgttgagga 
ggtcgctcac 
gcggctatcg 



caagaagaaa 
atattaccgg 
aacggacgct 
atgtgtcacc 
cgtgccacaa 
gggcatttac 
tctgtgcgag 
agttaggttg 
gttctgggag 
taagcaggca 
ggctcaggct 
tacgctgcac 
taccacacac 
cacgagcacc 
aacaggcagc 
cgacagggaa 
ttacatcgaa 
gcaaacagcc 
cctcgaagcc 
aggcttgtcc 
tatcaccagc 
ggccgcccaa 
agcggctgtt 
agcaggggtg 
cgaggacctg 
cgtgtgcgca 
gaaccggctg 
tgagagcgac 
gctgaagagg 
gctaagagat 
gtccaagctc 
gggagtctgg 
cggacatgtg 
gcatggaaca 
aaattattct 
gggggatttc 
tccggccccc 
gtgcaaaccc 
tgggtcacag 
cgacccctcc 
ctccttggcc 
tacccgtcat 
gatgggcggg 
cgagccgctc 
gaggtccagg 
actgttagag 
gccgcctgcc 
agaatctacc 
atcgtcggcc 
cgacgcggga 
ggatcccgat 
cgtctgctgc 
ggaaaccaag 
ctatgctaca 
gcaggtcctg 
agttaaggct 
cagatctaaa 
ccacatccgc 
catcatggca 
tcgccttatc 
tgtggtctcc 
tggacagcgg 
cgcatatgac 
gtcaatctac 
agagcggctt 
ccggtgccgc 



tgtgatgagc 
ggccttgatg 
ctaatgacgg 
cagacagtcg 
gacgcggtgt 
aggtttgtga 
tgctatgacg 
cgggcttacc 
agcgtcttta 
ggagacaact 
ccacctccat 
gggccaacgc 
cccataacca 
tgggtgctgg 
gtggtcattg 
gtcctttacc 
cagggaatgc 
accaagcaag 
ttctgggcga 
actctgcctg 
ccgctcacca 
cttgctcctc 
ggcagcatag 
gcaggcgcgc 
gttaacctac 
gcgatactgc 
atagcgttcg 
gctgcagcac 
cttcaccagt 
gtttgggatt 
ctgccgcgat 
cggggcgacg 
aaaaacggtt 
ttccccatta 
agggcgctgt 
cactacgtga 
gaattcttca 
ctcctacggg 
ctcccatgcg 
cacattacgg 
agctcatcag 
gactccccgg 
aacatcaccc 
caagcggagg 
aaattccctc 
tcctggaagg 
aaggcccctc 
gtgtcttctg 
gtcgacagcg 
tccgacgttg 
ctcagcgacg 
tcgatgtcct 
ctgcccatca 
acatctcgca 
gacgaccact 
aaacttctat 
tttggctatg 
tccgtgtgga 
aaaaatgagg 
gtattcccag 
accctccctc 
gtcgagttcc 
acccgctgtt 
caatgttgtg 
tacatcgggg 
gcgagcggtg 



tcgccgcgaa 
tatccgtcat 
gctttaccgg 
acttcagcct 
cacgctcgca 
ctccaggaga 
cgggctgtgc 
taaacacacc 
caggcctcac 
tcccctacct 
cgtgggacca 
ccctgctgta 
aatacatcat 
taggcggagt 
tgggcaggat 
gggagttcga 
agctcgccga 
cggaggctgc 
agcatatgtg 
gcaaccccgc 
cccaacatac 
ccagcgctgc 
gccttgggaa 
tcgtggcctt 
tccctgctat 
gtcggcacgt 
cttcgcgggg 
gtgtcactca 
ggatcaacga 
ggatatgcac 
tgccgggagt 
gcatcatgca 
ccatgaggat 
acgcgtacac 
ggcgggtggc 
cgggcatgac 
cagaagtgga 
aggaggtcac 
agcccgaacc 
cggagacggc 
ctagccagct 
acgctgacct 
gcgtggagtc 
aggatgagag 
gagcgatgcc 
acccggacta 
cgataccacc 
ccttggcgga 
gcacggcaac 
agtcgtactc 
ggtcttggtc 
acacatggac 
atgcactgag 
gcgcaagcct 
accgggacgt 
ccgtggagga 
gggcaaagga 
aggacttgct 
ttttctgcgt 
atttgggggt 
aggccgtgat 
tggtgaatgc 
ttgactcaac 
acttggcccc 
gccccctgac 
tactgacgac 



gctgtccggc 
accaactagc 
cgatttcgac 
ggacccgacc 
gcggcgaggc 
acggccctcg 
ttggtacgag 
agggttgccc 
ccacatagac 
ggtagcatac 
aatgtggaag 
taggctggga 
ggcatgcatg 
cctagcagct 
catcttgtcc 
tgagatggaa 
acaattcaaa 
tgctcccgtg 
gaatttcatc 
gatagcatca 
cctcctgttt 
ttctgctttc 
ggtgcttgtg 
taaggtcatg 
cctctcccct 
gggcccaggg 
taaccacgtc 
gatcctctct 
ggactgctcc 
ggtgttgact 
ccccttcttc 
aaccacctgc 
cgtggggcct 
cacgggcccc 
tgctgaggag 
cactgacaac 
tggggtgcgg 
attcctggtc 
ggacgtagca 
taagcgtagg 
gtctgcgcct 
catcgaggcc 
agaaaataag 
ggaagtatcc 
catatgggca 
cgtccctcca 
tccacggagg 
gctcgccaca 
ggcctctcct 
ctccatgccc 
taccgtaagc 
aggcgccctg 
caactctttg 
gcggcagaag 
gctcaaggag 
agcctgtaag 
cgtccggaac 
ggaagacact 
ccaaccagag 
tcgtgtgtgc 
gggctcttca 
ctggaaagcg 
ggtcactgag 
cgaagccaga 
taat tctaaa 
cagctgcggt 



3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
64 80 
6540 
6600 
6660 
6720 
67 80 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
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aataccctca catgttactt gaaggccgct gcggcctgtc gagctgcgaa gctccaggac 7 560 

tgcacgatgc tcgtatgcgg agacgacctt gtcgttatct gtgaaagcgc ggggacccaa 7620 

gaggacgagg cgagcctacg ggccttcacg gaggctatga ctagatactc tgccccccct 7680 

ggggacccgc ccaaaccaga atacgacttg gagttgataa catcatgctc ctccaatgtg 7740 

tcagtcgcgc acgatgcatc tggcaaaagg gtgtactatc tcacccgtga ccccaccacc 7 800 

ccccttgcgc gggctgcgtg ggagacagct agacacactc cagtcaattc ctggctaggc 7860 

aacatcatca tgtatgcgcc caccttgtgg gcaaggatga tcctgatgac tcatttcttc 7920 

tccatccttc tagctcagga acaacttgaa aaagccctag attgtcagat ctacggggcc 7980 

tgttactcca ttgagccact tgacctacct cagatcattc aacgactcca tggccttagc 8040 

gcattttcac tccatagtta ctctccaggt gagatcaata gggtggcttc atgcctcagg 8100 

aaacttgggg taccgccctt gcgagtctgg agacatcggg ccagaagtgt ccgcgctagg 8160 

ctactgtccc agggggggag ggctgccact tgtggcaagt acctcttcaa ctgggcagta 8220 

aggaccaagc tcaaactcac tccaatcccg gctgcgtccc agttggattt atccagctgg 8280 

ttcgttgctg gttacagcgg gggagacata tatcacagcc tgtctcgtgc ccgaccccgc 8340 

tggttcatgt ggtgcctact cctactttct gtaggggtag gcatctatct actccccaac 8400 

cgatgaacgg ggagctaaac actccaggcc aataggccat cctgtttttt tccctttttt 8460 

tttttctttt tttttttttt tttttttttt tttttttttt ctcctttttt tttcctcttt 8520 

ttttcctttt ctttcctttg gtggctccat cttagcccta gtcacggcta gctgtgaaag 8580 

gtccgtgagc cgcttgactg cagagagtgc tgatactggc ctctctgcag atcaagt 8637 
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<210> 3 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 



<40O> 3 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

tgcatcatca 

gtctccaccg 

tatcatggtg 

accaatgtgg 

ccatgcacct 

gtgcgccggc 

aagggctctt 

gctgccgtgt 

gaaaccacta 

acattccagg 

gctgcgtatg 

ctaggtttcg 

gtaaggacca 

gacggtggtt 

gactcgacca 

cgactcgtcg 

atcgaggagg 

atcgagacca 

gagctcgccg 

gatgtatccg 

acgggcttta 

gtcgacttca 

gtgtcacgct 

gtgactccag 

gacgcgggct 

tacctaaaca 

tttacaggcc 

aacttcccct 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatggcgcc 
ctagcctcac 
caacacaatc 
ccggctcaaa 
accaggacct 
gcggcagctc 
ggggcgacag 
cgggcggtcc 
gcacccgagg 
tgcggtcccc 
tggcccatct 
cagcccaagg 
gggcgtatat 
tcaccacggg 
gctctggggg 
ctatcctggg 
tgctcgccac 
tggctctgtc 
tcaagggggg 
cgaagctgtc 
tcataccaac 
ccggcgattt 
gcctggaccc 
cgcagcggcg 
gagaacggcc 
gtgcttggta 
caccagggtt 
tcacccacat 
acctggtagc 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
tattacggcc 
aggccgggac 
tttcctggcg 
gacccttgcc 
cgtcggctgg 
ggacctttac 
cagggggagc 
actgctctgc 
ggttgcgaag 
ggtcttcacg 
acacgcccct 
gtataaggtg 
gtctaaggca 
tgcccccatc 
cgcctatgac 
catcggcaca 
cgctacgcct 
cagcactgga 
gaggcacctc 
cggcctcgga 
tagcggagac 
cgactcagtg 
gaccttcacc 
aggcaggact 
ctcgggcatg 
cgagctcacg 
gcccgtctgc 
agacqcccat 
ataccaggct 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accacgggga 
tactcccaac 
aggaaccagg 
acctgcgtca 
ggcccaaagg 
caagcgcccc 
ttggtcacga 
ctactctccc 
ccctcggggc 
gcggtggact 
gacaactcgt 
actggtagcg 
cttgtcctga 
catggtatcg 
acgtactcca 
atcataatat 
gtcctggacc 
ccgggatcgg 
gaaatcccct 
attttctgcc 
ctcaatgctg 
gtcattgtcg 
atcgactgca 
attgagacga 
ggtaggggca 
ttcgattcct 
cccgccgaga 
caggaccatc 
ttcttgtccc 
acggtgtgcg 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
agacgcgagg 
tcgaggggga 
atggcgtgtg 
gcccaatcac 
ccggggcgcg 
ggcatgccga 
ccaggcccgt 
acgctgtggg 
ttgtacccgt 
cccctccggc 
gcaagagcac 
acccgtccgt 
accctaacat 
cctatggcaa 
gtgatgagtg 
aagcggagac 
tcaccgtgcc 
tttatggcaa 
attccaagaa 
tagcatatta 
tagcaacgga 
atacatgtgt 
cgaccgtgcc 
ggatgggcat 
cggttctgtg 
cctcagttag 
tggagttctg 
agactaagca 
ccagggctca 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gcgcggctat 
actgaagcgg 
tctcaccttg 
acgcttgatc 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
acccgtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
cctacttggc 
ggtccaagtg 
ttggactgtc 
ccaaatgtac 
ttccttgaca 
tgtcattccg 
ctcctacttg 
catctttcgg 
cgagtctatg 
cgtaccgcag 
taaggtgccg 
cgccgccacc 
cagaaccggg 
gtttcttgcc 
ccactcaact 
ggctggagcg 
acatccaaac 
agccatcccc 
gaaatgtgat 
ccggggcctt 
cgctctaatg 
cacccagaca 
acaagacgcg 
ttacaggttt 
cgagtgctat 
gttgcgggct 
ggagagcgtc 
ggcaggagac 
ggctccacct 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1X40 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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ccatcgtggg 
acgcccctgc 
accaaataca 
ctggtaggcg 
attgtgggca 
taccgggagt 
atgcagctcg 
caagcggagg 
gcgaagcata 
cctggcaacc 
accacccaac 
cctcccagcg 
ataggccttg 
gcgctcgtgg 
ctactccctg 
ctgcgtcggc 
ttcgcttcgc 
gcacgtgtca 
cagtggatca 
gattggatat 
cgattgccgg 
gacggcatca 
ggttccatga 
attaacgcgt 
ctgtggcggg 
gtgacgggca 
ttcacagaag 
cgggaggagg 
tgcgagcccg 
acggcggaga 
tcagctagcc 
ccggacgctg 
acccgcgtgg 
gaggaggatg 
cctcgagcga 
aaggacccgg 
cctccgatac 
tctgccttgg 
agcggcacgg 
gttgagtcgt 
gacgggtctt 
tcctacacat 
atcaatgcac 
cgcagcgcaa 
cactaccggg 
ctatccgtgg 
tatggggcaa 
tggaaggact 
gaggttttct 
ccagatttgg 
cctcaggccg 
ttcctggtga 
tgttttgact 
tgtgacttgg 
gggggccccc 
ggtgtactga 
tgtcgagctg 
atctgtgaaa 
atgactagat 
ataacatcat 
tatctcaccc 
actccagtca 
atgatcctga 
ctagattgtc 
attcaacgac 
aatagggtgg 



accaaatgtg 
tgtataggct 
tcatggcatg 
gagtcctagc 
ggatcatctt 
tcgatgagat 
ccgaacaatt 
ctgctgctcc 
tgtggaattt 
ccgcgatagc 
ataccctcct 
ctgcttctgc 
ggaaggtgct 
cctttaaggt 
ctatcctctc 
acgtgggccc 
ggggtaacca 
ctcagatcct 
acgaggactg 
gcacggtgtt 
gagtcccctt 
tgcaaaccac 
ggatcgtggg 
acaccacggg 
tggctgctga 
tgaccactga 
tggatggggt 
tcacattcct 
aaccggacgt 
cggctaagcg 
agctgtctgc 
acctcatcga 
agtcagaaaa 
agagggaagt 
tgcccatatg 
actacgtccc 
cacctccacg 
cggagctcgc 
caacggcctc 
actcctccat 
ggtctaccgt 
ggacaggcgc 
tgagcaactc 
gcctgcggca 
acgtgctcaa 
aggaagcctg 
aggacgtccg 
tgctggaaga 
gcgtccaacc 
gggttcgtgt 
tgatgggctc 
atgcctggaa 
caacggtcac 
cccccgaagc 
tgactaattc 
cgaccagctg 
cgaagctcca 
gcgcggggac 
actctgcccc 
gctcctccaa 
gtgaccccac 
attcctggct 
tgactcattt 
agatctacgg 
tccatggcct 
cttcatgcct 



gaagtgtctc 
gggagccgtt 
catgtcggct 
agctctggcc 
gtccggaaag 
ggaagagtgc 
caaacagaag 
cgtggtggaa 
catcagcggg 
atcactgatg 
gtttaacatc 
tttcgtaggc 
tgtggatatt 
catgagcggc 
ccctggcgcc 
aggggagggg 
cgtctccccc 
ctctagtctt 
ctccacgcea 
gactgatttc 
cttctcatgt 
ctgcccatgt 
gcctaggacc 
cccctgcacg 
ggagtacgtg 
caacgtaaag 
gcggttgcac 
ggtcgggctc 
agcagtgctc 
taggctggcc 
gccttccttg 
ggccaacctc 
taaggtagta 
atccgttccg 
ggcacgcccg 
tccagtggta 
gaggaagagg 
cacaaagacc 
tcctgaccag 
gccccccctt 
aagcgaggag 
cctgatcacg 
tttgctccgt 
gaagaaggtc 
ggagatgaag 
taagctgacg 
gaacctatcc 
cactgagaca 
agagaagggg 
gtgcgagaaa 
ttcatacgga 
agcgaagaaa 
tgagaatgac 
cagacaggcc 
taaagggcag 
cggtaatacc 
ggactgcacg 
ccaagaggac 
ccctggggac 
tgtgtcagtc 
cacccccctt 
aggcaacatc 
cttctccatc 
ggcctgttac 
tagcgcattt 
caggaaactt 



atacggctaa 
caaaacgagg 
gacctggagg 
gcgtattgcc 
ccggccatca 
gcctcacacc 
gcaatcgggt 
tccaagtggc 
atacaatatt 
gcattcacag 
ctggggggat 
gccggcatcg 
ttggcaggtt 
gagatgccct 
ctagtcgtcg 
gctgtgcagt 
acgcactatg 
accatcactc 
tgctccggct 
aagacctggc 
caacgtgggt 
ggagcacaga 
tgtagtaaca 
ccctccccgg 
gaggttacgc 
tgcccgtgtc 
aggtacgctc 
aatcaatacc 
acttccatgc 
aggggatctc 
aaggcaacat 
ctgtggcggc 
attttggact 
gcggagatcc 
gattacaacc 
cacgggtgtc 
acggttgtcc 
ttcggcagct 
ccctccgacg 
gagggggagc 
gctagtgagg 
ccatgcgctg 
caccacaact 
acctttgaca 
gcgaaggcgt 
cccccacatt 
agcaaggccg 
ccaattgaca 
ggccgcaagc 
atggcccttt 
ttccaatact 
tgccctatgg 
atccgtgttg 
ataaggtcgc 
aactgcggct 
ctcacatgtt 
atgctcgtat 
gaggcgagcc 
ccgcccaaac 
gcgcacgatg 
gcgcgggctg 
atcatgtatg 
cttctagctc 
tccattgagc 
tcactccata 
ggggtaccgc 



agcctacgct 
ttactaccac 
tcgtcacgag 
tgacaacagg 
ttcccgacag 
tcccttacat 
tgctgcaaac 
ggaccctcga 
tagcaggctt 
cctctatcac 
gggtggccgc 
ctggagcggc 
atggagcagg 
ccaccgagga 
gggtcgtgtg 
ggatgaaccg 
tgcctgagag 
agctgctgaa 
cgtggctaag 
tccagtccaa 
acaagggagt 
tcaccggaca 
cgtggcatgg 
cgccaaatta 
gggtggggga 
aggttccggc 
cagcgtgcaa 
tggttgggtc 
tcaccgaccc 
ccccctcctt 
gcactacccg 
aggagatggg 
ctttcgagcc 
tgcggaggtc 
ctccactgtt 
cattgccgcc 
tgtcagaatc 
ccgaatcgtc 
acggcgacgc 
cgggggatcc 
acgtcgtctg 
cggaggaaac 
tggtctatgc 
gactgcaggt 
ccacagttaa 
cggccagatc 
ttaaccacat 
ccaccatcat 
cagctcgcct 
acgatgtggt 
ctcctggaca 
gcttcgcata 
aggagtcaat 
tcacagagcg 
atcgccggtg 
acttgaaggc 
gcggagacga 
tacgggcctt 
cagaatacga 
catctggcaa 
cgtgggagac 
cgcccacctt 
aggaacaact 
cacttgacct 
gttactctcc 
ccttgcgagt 



gcacgggcca 
acaccccata 
cacctgggtg 
cagcgtggtc 
ggaagtcctt 
cgaacaggga 
agccaccaag 
agccttctgg 
gtccactctg 
cagcccgctc 
ccaacttgct 
tgttggcagc 
ggtggcaggc 
cctggttaac 
cgcagcgata 
gctgatagcg 
cgacgctgca 
gaggcttcac 
agatgtttgg 
gctcctgccg 
ctggcggggc 
tgtgaaaaac 
aacattcccc 
ttctagggcg 
tttccactac 
ccccgaattc 
acccctccta 
acagctccca 
ctcccacatt 
ggccagctca 
tcatgactcc 
cgggaacatc 
gctccaagcg 
caggaaattc 
agagtcctgg 
tgccaaggcc 
taccgtgtct 
ggccgtcgac 
gggatccgac 
cgatctcagc 
ctgctcgatg 
caagctgccc 
tacaacatct 
cctggacgac 
ggctaaactt 
taaatttggc 
ccgctccgtg 
ggcaaaaaat 
tatcgtattc 
ctccaccctc 
gcgggtcgag 
tgacacccgc 
ctaccaatgt 
gctttacatc 
ccgcgcgagc 
cgctgcggcc 
ccttgtcgtt 
cacggaggct 
cttggagttg 
aagggtgtac 
agctagacac 
gtgggcaagg 
tgaaaaagcc 
acctcagatc 
aggtgagatc 
ctggagacat 



3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
46BO 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 

aagctcaaac tcactccaat cccggctgcg 7620 

gctggttaca gcgggggaga catatatcac 7680 

atgtggtgcc tactcctact ttctgtaggg 7740 

acggggagct aaacactcca ggccaatagg 7800 

tttttttttt tttttttttt tttttttttt 7860 

ttttctttcc tttggtggct ccatcttagc 7920 

gagccgcttg actgcagaga gtgctgatac 7980 

8001 
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<210> 4 
<211> 7989 
<212> DNA 

<213> Hepatitis C Virus 



<400> 4 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

cggccgcttg 

ctgatgccgc 

acctgtccgg 

cgacgggcgt 

tgctattggg 

aagtatccat 

cattcgacca 

ttgtcgatca 

ccaggctcaa 

gcttgccgaa 

tgggtgtggc 

ttggcggcga 

agcgcatcgc 

gtttccctct 

cgaagccgct 

ccgtcttttg 

aggggt cttt 

gttcctctgg 

aaccccccac 

gcaaaggcgg 

tggctctcct 

atgggatctg 

aacgtctagg 

atggcgccta 

agcctcacag 

acacaatctt 

ggctcaaaga 

caggacctcg 

ggcagctcgg 

ggcgacagca 

ggcggtccac 

acccgagggg 

cggtccccgg 

gcccatctac 

gcccaagggt 

gcgtatatgt 

accacgggtg 

tctgggggcg 

atcctgggca 

ctcgccaccg 

gctctgtcca 

aaggggggga 

aagctgtccg 

ataccaacta 

ggcgatttcg 

ctggacccga 

cagcggcgag 

gaacggccct 

gcttggtacg 

ccagggttgc 

acccacatag 

ctggtagcat 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaaggg 
ggtggagagg 
cgtgttccgg 
tgccctgaat 
tccttgcgca 
cgaagtgccg 
catggctgat 
ccaagcgaaa 
ggatgatctg 
ggcgcgcatg 
tatcatggtg 
ggaccgctat 
atgggctgac 
cttctatcgc 
agcgggatca 
tggaataagg 
gcaatgtgag 
cccctctcgc 
aagcttcttg 
ctggcgacag 
cacaacccca 
caagcgtatt 
atctggggcc 
ccccccgaac 
ttacggccta 
gccgggacag 
tcctggcgac 
cccttgccgg 
tcggctggca 
acctttactt 
gggggagcct 
tgctctgccc 
ttgcgaaggc 
tcttcacgga 
acgcccctac 
ataaggtgct 
ctaaggcaca 
cccccatcac 
cctatgacat 
tcggcacagt 
ctacgcctcc 
gcactggaga 
ggcacctcat 
gcctcggact 
gcggagacgt 
actcagtgat 
ccttcaccat 
gcaggactgg 
cgggcatgtt 
agctcacgcc 
ccgtctgcca 
acgcccattt 
accaggctac 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
cgcgccatga 
ctattcggct 
ctgtcagcgc 
gaactgcagg 
gctgtgctcg 
gggcaggatc 
gcaatgcggc 
catcgcatcg 
gacgaagagc 
cccgacggcg 
gaaaatggcc 
caggacatag 
cgcttcctcg 
cttcttgacg 
attccgcccc 
ccggtgtgcg 
ggcccggaaa 
caaaggaatg 
aagacaaaca 
gtgcctctgc 
gtgccacgtt 
caacaagggg 
tcggtgcaca 
cacggggacg 
ctcccaacag 
gaaccaggtc 
ctgcgtcaat 
cccaaagggc 
agcgcccccc 
ggtcacgagg 
actctccccc 
ctcggggcac 
ggtggacttt 
caactcgtcc 
tggtagcggc 
tgtcctgaac 
tggtatcgac 
gtactccacc 
cataatatgt 
cctggaccaa 
gggatcggtc 
aatccccttt 
tttctgccat 
caatgctgta 
cattgtcgta 
cgactgcaat 
tgagacgacg 
taggggcagg 
cgattcctcg 
cgccgagacc 
ggaccatctg 
cttgtcccag 
ggtgtgcgcc 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ttgaacaaga 
atgactgggc 

aggggcgccc 

acgaggcagc 
acgttgtcac 
tcctgtcatc 
ggctgcatac 
agcgagcacg 
atcaggggct 
aggatctcgt 
gcttttctgg 
cgttggctac 
tgctttacgg 
agttcttctg 
tctccctccc 
tttgtctata 
cctggccctg 
caaggtctgt 
acgtctgtag 
ggccaaaagc 
gtgagttgga 
ctgaaggatg 
tgctttacat 
tggttttcct 
acgcgaggcc 
gagggggagg 
ggcgtgtgtt 
ccaatcaccc 
ggggcgcgtt 
catgccgatg 
aggcccgtct 
gctgtgggca 
gtacccgtcg 
cctccggccg 
aagagcacta 
ccgtccgtcg 
cctaacatca 
tatggcaagt 
gatgagtgcc 
gcggagacgg 
accgtgccac 
tatggcaaag 
tccaagaaga 
gcatattacc 
gcaacggacg 
acatgtgtca 
accgtgccac 
atgggcattt 
gttctgtgcg 
tcagttaggt 
gagttctggg 
actaagcagg 
agggctcagg 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
tggattgcac 
acaacagaca 
ggttcttttt 
gcggctatcg 
tgaagcggga 
tcaccttgct 
gcttgatccg 
tactcggatg 
cgcgccagcc 
cgtgacccat 
attcatcgac 
ccgtgatatt 
tatcgccgct 
agtttaaaca 
ccccccctaa 
tgttattttc 
tcttcttgac 
tgaatgtcgt 
cgaccctttg 
cacgtgtata 
tagttgtgga 
cccagaaggt 
gtgtttagtc 
ttgaaaaaca 
tacttggctg 
tccaagtggt 
ggactgtcta 
aaatgtacac 
ccttgacacc 
tcattccggt 
cctacttgaa 
tctttcgggc 
agtctatgga 
taccgcagac 
aggtgccggc 
ccgccaccct 
gaaccggggt 
ttcttgccga 
actcaactga 
ctggagcgcg 
atccaaacat 
ccatccccat 
aatgtgatga 
ggggccttga 
ctctaatgac 
cccagacagt 
aagacgcggt 
acaggtttgt 
agtgctatga 
tgcgggctta 
agagcgtctt 
caggagacaa 
ctccacctcc 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gcaggttctc 
atcggctgct 
gtcaagaccg 
tggctggcca 
agggactggc 
cctgccgaga 
gctacctgcc 
gaagccggtc 
gaactgttcg 
ggcgatgcct 
tgtggccggc 
gctgaagagc 
cccgattcgc 
gaccacaacg 
cgttactggc 
caccatattg 
gagcattcct 
gaaggaagca 
caggcagcgg 
agatacacct 
aagagtcaaa 
accccattgt 
gaggttaaaa 
cgataatacc 
catcatcact 
ctccaccgca 
tcatggtgcc 
caatgtggac 
atgcacctgc 
gcgccggcgg 
gggctcttcg 
tgccgtgtgc 
aaccactatg 
attccaggtg 
tgcgtatgca 
aggtttcggg 
aaggaccatc 
cggtggttgc 
ctcgaccact 
actcgtcgtg 
cgaggaggtg 
cgagaccatc 
gctcgccgcg 
tgtatccgtc 
gggctttacc 
cgacttcagc 
gtcacgctcg 
gactccagga 
cgcgggctgt 
cctaaacaca 
tacaggcctc 
cttcccctac 
atcgtgggac 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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caaatgtgga 
tataggctgg 
atggcatgca 
gtcctagcag 
atcatcttgt 
gatgagatgg 
gaacaattca 
gctgctcccg 
tggaatttca 
gcgatagcat 
accctcctgt 
gcttctgctt 
aaggtgcttg 
tttaaggtca 
atcctctccc 
gtgggcccag 
ggtaaccacg 
cagatcctct 
gaggactgct 
acggtgttga 
gtccccttct 
caaaccacct 
atcgtggggc 
accacgggcc 
gctgctgagg 
accactgaca 
gatggggtgc 
acattcctgg 
ccggacgtag 
gctaagcgta 
ctgtctgcgc 
ctcatcgagg 
tcagaaaata 
agggaagtat 
cccatatggg 
tacgtccctc 
cctccacgga 
gagctcgcca 
acggcctctc 
tcctccatgc 
tctaccgtaa 
acaggcgccc 
agcaactctt 
ctgcggcaga 
gtgctcaagg 
gaagcctgta 
gacgtccgga 
ctggaagaca 
gtccaaccag 
gttcgtgtgt 
atgggctctt 
gcctggaaag 
acggtcactg 
cccgaagcca 
actaattcta 
accagctgcg 
aagctccagg 
gcggggaccc 
tctgcccccc 
tcctccaatg 
gaccccacca 
tcctggctag 
actcatttct 
atctacgggg 
catggcctta 
tcatgcctca 



agtgtctcat 
gagccgttca 
tgtcggctga 
ctctggccgc 
ccggaaagcc 
aagagtgcgc 
aacagaaggc 
tggtggaatc 
tcagcgggat 
cactgatggc 
ttaacatcct 
tcgtaggcgc 
tggatatttt 
tgagcggcga 
ctggcgccct 
gggagggggc 
tctcccccac 
ctagtcttac 
ccacgccatg 
ctgatttcaa 
tctcatgtca 
gcccatgtgg 
ctaggacctg 
cctgcacgcc 
agtacgtgga 
acgtaaagtg 
ggttgcacag 
tcgggctcaa 
cagtgctcac 
ggctggccag 
cttccttgaa 
ccaacctcct 
aggtagtaat 
ccgttccggc 
cacgcccgga 
cagtggtaca 
ggaagaggac 
caaagacctt 
ctgaccagcc 
ccccccttga 
gcgaggaggc 
tgatcacgcc 
tgctccgtca 
agaaggtcac 
agatgaaggc 
agctgacgcc 
acctatccag 
ctgagacacc 
agaagggggg 
gcgagaaaat 
catacggatt 
cgaagaaatg 
agaatgacat 
gacaggccat 
aagggcagaa 
gtaataccct 
actgcacgat 
aagaggacga 
ctggggaccc 
tgtcagtcgc 
ccccccttgc 
gcaacatcat 
tctccatcct 
cctgttactc 
gcgcattttc 
ggaaacttgg 



acggctaaag 
aaacgaggtt 
cctggaggtc 
gtattgcctg 
ggccatcatt 
ctcacacctc 
aatcgggttg 
caagtggcgg 
acaatattta 
attcacagcc 
ggggggatgg 

cggcatcgct 
ggcaggttat 
gatgccctcc 
agtcgtcggg 
tgtgcagtgg 
gcactatgtg 
catcactcag 
ctccggctcg 
gacctggctc 
acgtgggtac 
agcacagatc 
tagtaacacg 
ctccccggcg 
ggttacgcgg 
cccgtgtcag 
gtacgctcca 
tcaatacctg 
ttccatgctc 
gggatctccc 
ggcaacatgc 
gtggcggcag 
tttggactct 
ggagatcctg 
ttacaaccct 
cgggtgtcca 
ggttgtcctg 
cggcagctcc 
ctccgacgac 
gggggagccg 
tagtgaggac 
atgcgctgcg 
ccacaacttg 
ctttgacaga 
gaaggcgtcc 
cccacattcg 
caaggccgtt 
aattgacacc 
ccgcaagcca 
ggccctttac 
ccaatactct 
ccctatgggc 
ccgtgttgag 
aaggtcgctc 
ctgcggctat 
cacatgttac 
gctcgtatgc 
ggcgagccta 
gcccaaacca 
gcacgatgca 
gcgggctgcg 
catgtatgcg 
tctagctcag 
cattgagcca 
actccatagt 
ggtaccgccc 



cctacgctgc 
actaccacac 
gtcacgagca 
acaacaggca 
cccgacaggg 
ccttacatcg 
ctgcaaacag 
accctcgaag 
gcaggcttgt 
tctatcacca 
gtggccgccc 
ggagcggctg 
ggagcagggg 
accgaggacc 
gtcgtgtgcg 
atgaaccggc 
cctgagagcg 
ctgctgaaga 
tggctaagag 
cagtccaagc 
aagggagtct 
accggacatg 
tggcatggaa 
ccaaattatt 
gtgggggatt 
gttccggccc 
gcgtgcaaac 
gttgggtcac 
accgacccct 
ccctccttgg 
actacccgtc 
gagatgggcg 
ttcgagccgc 
cggaggtcca 
ccactgttag 
ttgccgcctg 
tcagaatcta 
gaatcgtcgg 
ggcgacgcgg 
ggggatcccg 
gtcgtctgct 
gaggaaacca 
gtctatgcta 
ctgcaggtcc 
acagttaagg 
gccagatcta 
aaccacatcc 
accatcatgg 
gctcgcctta 
gatgtggtct 
cctggacagc 
ttcgcatatg 
gagtcaatct 
acagagcggc 
cgccggtgcc 
ttgaaggccg 
ggagacgacc 
cgggccttca 
gaatacgact 
tctggcaaaa 
tgggagacag 
cccaccttgt 
gaacaacttg 
cttgacctac 
tactctccag 
ttgcgagtct 



acgggccaac 
accccataac 
cctgggtgct 
gcgtggtcat 
aagtccttta 
aacagggaat 
ccaccaagca 
ccttctgggc 
ccactctgcc 
gcccgctcac 
aacttgctcc 
ttggcagcat 
tggcaggcgc 
tggttaacct 
cagcgatact 
tgatagcgtt 
acgctgcagc 
ggcttcacca 
atgtttggga 
tcctgccgcg 
ggcggggcga 
tgaaaaacgg 
cattccccat 
ctagggcgct 
tccactacgt 
ccgaattctt 
ccctcctacg 
agctcccatg 
cccacattac 
ccagctcatc 
atgactcccc 
ggaacatcac 
tccaagcgga 
ggaaattccc 
agtcctggaa 
ccaaggcccc 
ccgtgtcttc 
ccgtcgacag 
gatccgacgt 
atctcagcga 
gctcgatgtc 
agctgcccat 
caacatctcg 
tggacgacca 
ctaaacttct 
aatttggcta 
gctccgtgtg 
caaaaaatga 
tcgtattccc 
ccaccctccc 
gggtcgagtt 
acacccgctg 
accaatgttg 
tttacatcgg 
gcgcgagcgg 
ctgcggcctg 
ttgtcgttat 
cggaggctat 
tggagttgat 
gggtgtacta 
ctagacacac 
gggcaaggat 
aaaaagccct 
ctcagatcat 
gtgagatcaa 
ggagacatcg 



gcccctgctg 
caaatacatc 
ggtaggcgga 
tgtgggcagg 
ccgggagttc 
gcagctcgcc 
agcggaggct 
gaagcatatg 
tggcaacccc 
cacccaacat 
tcccagcgct 
aggccttggg 
gctcgtggcc 
actccctgct 
gcgtcggcac 
cgcttcgcgg 
acgtgtcact 
gtggatcaac 
ttggatatgc 
attgccggga 
cggcatcatg 
ttccatgagg 
taacgcgtac 
gtggcgggtg 
gacgggcatg 
cacagaagtg 
ggaggaggtc 
cgagcccgaa 
ggcggagacg 
agctagccag 
ggacgctgac 
ccgcgtggag 
ggaggatgag 
tcgagcgatg 
ggacccggac 
tccgatacca 
tgccttggcg 
cggcacggca 
tgagtcgtac 
cgggtcttgg 
ctacacatgg 
caatgcactg 
cagcgcaagc 
ctaccgggac 
atccgtggag 
tggggcaaag 
gaaggacttg 
ggttttctgc 
agatttgggg 
tcaggccgtg 
cctggtgaat 
ttttgactca 
tgacttggcc 
gggccccctg 
tgtactgacg 
tcgagctgcg 
ctgtgaaagc 
gactagatac 
aacatcatgc 
tctcacccgt 
tccagtcaat 
gatcctgatg 
agattgtcag 
tcaacgactc 
tagggtggct 
ggccagaagt 



3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
64 8 0 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 



39 



EP 1 043 399 A2 



gtccgcgcta ggctactgtc ccaggggggg 
aactgggcag taaggaccaa gctcaaactc 
ttatccagct ggttcgttgc tggttacagc 
gcccgacccc gctggttcat gtggtgccta 
ctactcccca accgatgaac ggggagctaa 
tttccctttt tttttttctt tttttttttt 
tttttcctct ttttttcctt ttctttcctt 
tagctgtgaa aggtccgtga gccgcttgac 
agatcaagt 



agggctgcca cttgtggcaa gtacctcttc 7560 
actccaatcc cggctgcgtc ccagttggat 7620 
gggggagaca tatatcacag cctgtctcgt 7680 
ctcctacttt ctgtaggggt aggcatctat 7740 
acactccagg ccaataggcc atcctgtttt 7800 
tttttttttt tttttttttt ttctcctttt 7860 
tggtggctcc atcttagccc tagtcacggc 7920 
tgcagagagt gctgatactg gcctctctgc 7980 

7989 



40 



EP 1 043 399 A2 



<210> 5 
<211> 8649 
<212> DNA 

<213> Hepatitis C Virus 



<400> 5 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

ctgatactct 

ttacaatatt 

gttcgggggg 

tttaccatca 

ataaccaaag 

cggaaggttg 

ggtacgtacg 

gaccttgcgg 

tggggggcag 

agggggaggg 

ctcgcgccta 

agcctcacag 

acacaatctt 

ggctcaaaga 

caggacctcg 

ggcagctcgg 

ggcgacagca 

ggcggtccac 

acccgagggg 

cggtccccgg 

gcccatctac 

gcccaagggt 

gcgtatatgt 

accacgggtg 

tctgggggcg 

atcctgggca 

ctcgccaccg 

gctctgtcca 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatggaccg 
tgaccttgtc 
ttatcaccag 
gccgcgatgc 
ccaaaatctt 
tgccgtactt 
ctgggggtca 
tttatgacca 
tggcagttga 
acaccgcggc 
agatacatct 
ttacggccta 
gccgggacag 
tcctggcgac 
cccttgccgg 
tcggctggca 
acctttactt 
gggggagcct 
tgctctgccc 
ttgcgaaggc 
tcttcacgga 
acgcccctac 
ataaggtgct 
ctaaggcaca 
cccccatcac 
cctatgacat 
tcggcacagt 
ctacgcctcc 
gcactggaga 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
ggagatggca 
accgcactat 
ggccgaggca 
cgtcatcctc 
gctcgccata 
cgtgcgcgca 
ttatgtccaa 
tctcacccca 
gcccgtcgtc 
gtgtggggac 
gggaccggca 
ctcccaacag 
gaaccaggtc 
ctgcgtcaat 
cccaaagggc 
agcgcccccc 
ggtcacgagg 
actctccccc 
ctcggggcac 
ggtggacttt 
caactcgtcc 
tggtagcggc 
tgtcctgaac 
tggtatcgac 
gtactccacc 
cataatatgt 
cctggaccaa 
gggatcggtc 
aatccccttt 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accacgggga 
gcatcgtgcg 
aagctgttcc 
cacttgcaag 
ctcacgtgcg 
ctcggtccac 
cacgggctca 
atggctctca 
ctgcgggact 
ttctctgata 
atcatcttgg 
gacagccttg 
acgcgaggcc 
gagggggagg 
ggcgtgtgtt 
ccaatcaccc 
ggggcgcgtt 
catgccgatg 
aggcccgtct 
gctgtgggca 
gtacccgtcg 
cctccggccg 
aagagcacta 
ccgtccgtcg 
cctaacatca 
tatggcaagt 
yatgagtgcc 
gcggagacgg 
accgtgccac 
tatggcaaag 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
gaggcgcggt 
tcgctaggct 
tgtggatccc 
cgatccaccc 
tcatggtgct 
ttcgtgcatg 
tgaagttggc 
gggcccacgc 
tggagaccaa 
gcctgcccgt 
aagggcaggg 
tacttggctg 
tccaagtggt 
ggactgtcta 
aaatgtacac 
ccttgacacc 
tcattccggt 
cctacttgaa 
tctttcgggc 
agtctatgga 
taccgcagac 
aggtgccggc 
ccgccaccct 
gaaccggggt 
ttcttgccga 
actcaactga 
ctggagcgcg 
atccaaacat 
ccatccccat 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gcgcggctat 
actgaagcgg 
tctcaccttg 
acgcttgatc 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
acccgtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
tttcgtaggt 
catatggtgg 
ccccctcaac 
agagctaatc 
ccaggctggt 
catgctggtg 
cgcactgaca 
gggcctacga 
ggttatcacc 
ctccgcccgc 
gtggcgactc 
catcatcact 
ctccaccgca 
tcatggtgcc 
caatgtggac 
atgcacctgc 
gcgccggcgg 
gggctcttcg 
tgccgtgtgc 
aaccactatg 
attccaggtg 
tgcgtatgca 
aggtttcggg 
aaggaccatc 
cggtggttgc 
ctcgaccact 
actcgtcgtg 
cgaggaggtg 
cgagaccatc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1B00 

I860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 



41 



EP 1 043 399 A2 



aaggggggga ggcacctcat tttctgccat tccaagaaga aatgtgatga gctcgccgcg 3600 

aagctgtccg gcctcggact caatgctgta gcatattacc ggggccttga tgtatccgtc 3660 

ataccaacta gcggagacgt cattgtcgta gcaacggacg ctctaatgac gggctttacc 3720 

ggcgatttcg actcagtgat cgactgcaat acatgtgtca cccagacagt cgacttcagc 3780 

5 ctggacccga ccttcaccat tgagacgacg accgtgccac aagacgcggt gtcacgctcg 3840 

cagcggcgag gcaggactgg taggggcagg atgggcattt acaggtttgt gactccagga 3900 

gaacggccct cgggcatgtt cgattcctcg gttctgtgcg agtgctatga cgcgggctgt 3960 

gcttggtacg agctcacgcc cgccgagacc tcagttaggt tgcgggctta cctaaacaca 4020 

ccagggttgc ccgtctgcca ggaccatctg gagttctggg agagcgtctt tacaggcctc 4080 

acccacatag acgcccattt cttgtcccag actaagcagg caggagacaa cttcccctac 4140 

10 ctggtagcat accaggctac ggtgtgcgcc agggctcagg ctccacctcc atcgtgggac 4200 

caaatgtgga agtgtctcat acggctaaag cctacgctgc acgggccaac gcccctgctg 4260 

tataggctgg gagccgttca aaacgaggtt actaccacac accccataac caaatacatc 4320 

atggcatgca tgtcggctga cctggaggtc gtcacgagca cctgggtgct ggtaggcgga 4380 

gtcctagcag ctctggccgc gtattgcctg acaacaggca gcgtggtcat tgtgggcagg 4440 

atcatcttgt ccggaaagcc ggccatcatt cccgacaggg aagtccttta ccgggagttc 4500 

gatgagatgg aagagtgcgc ctcacacctc ccttacatcg aacagggaat gcagctcgcc 4560 

15 gaacaattca aacagaaggc aatcgggttg ctgcaaacag ccaccaagca agcggaggct 4620 

gctgctcccg tggtggaatc caagtggcgg accctcgaag ccttctgggc gaagcatatg 4680 

tggaatttca tcagcgggat acaatattta gcaggcttgt ccactctgcc tggcaacccc 4740 

gcgatagcat cactgatggc attcacagcc tctatcacca gcccgctcac cacccaacat 4800 

accctcctgt ttaacatcct ggggggatgg gtggccgccc aacttgctcc tcccagcgct 4860 

gcttctgctt tcgtaggcgc cggcatcgct ggagcggctg ttggcagcat aggccttggg 4920 

20 aaggtgcttg tggatatttt ggcaggttat ggagcagggg tggcaggcgc gctcgtggcc 4980 

tttaaggtca tgagcggcga gatgccctcc accgaggacc tggttaacct actccctgct 504 0 

atcctctccc ctggcgccct agtcgtcggg gtcgtgtgcg cagcgatact gcgtcggcac 5100 

gtgggcccag gggagggggc tgtgcagtgg atgaaccggc tgatagcgtt cgcttcgcgg 5160 

ggtaaccacg tctcccccac gcactatgtg cctgagagcg acgctgcagc acgtgtcact 5220 

cagatcctct ctagtcttac catcactcag ctgctgaaga ggcttcacca gtggatcaac 5280 

gaggactgct ccacgccatg ctccggctcg tggctaagag atgtttggga ttggatatgc 5340 

25 acggtgttga ctgatttcaa gacctggctc cagtccaagc tcctgccgcg attgccggga 5400 

gtccccttct tctcatgtca acgtgggtac aagggagtct ggcggggcga cggcatcatg 5460 

caaaccacct gcccatgtgg agcacagatc accggacatg tgaaaaacgg ttccatgagg 5520 

atcgtggggc ctaggacctg tagtaacacg tggcatggaa cattccccat taacgcgtac 5580 

accacgggcc cctgcacgcc ctccccggcg ccaaattatt ctagggcgct gtggcgggtg 5640 

gctgctgagg agtacgtgga ggttacgcgg gtgggggatt tccactacgt gacgggcatg 5700 

20 accactgaca acgtaaagtg cccgtgtcag gttccggccc ccgaattctt cacagaagtg 57 60 

gatggggtgc ggttgcacag gtacgctcca gcgtgcaaac ccctcctacg ggaggaggtc 5820 

acattcctgg tcgggctcaa tcaatacctg gttgggtcac agctcccatg cgagcccgaa 5880 

ccggacgtag cagtgctcac ttccatgctc accgacccct cccacattac ggcggagacg 5940 

gctaagcgta ggctggccag gggatctccc ccctccttgg ccagctcatc agctagccag 6000 

ctgtctgcgc cttccttgaa ggcaacatgc actacccgtc atgactcccc ggacgctgac 6060 

ctcatcgagg ccaacctcct gtggcggcag gagatgggcg ggaacatcac ccgcgtggag 6120 

35 tcagaaaata aggtagtaat tttggactct ttcgagccgc tccaagcgga ggaggatgag 6180 

agggaagtat ccgttccggc ggagatcctg cggaggtcca ggaaattccc tcgagcgatg 6240 

cccatatggg cacgcccgga ttacaaccct ecactgttag agtectggaa ggacccggac 6300 

tacgtccctc cagtggtaca cgggtgtcca ttgccgcctg ccaaggcccc tccgatacca 6360 

cctccacgga ggaagaggac ggttgtcctg tcagaatcta ccgtgtcttc tgccttggcg 6420 

gagctcgcca caaagacctt cggcagctcc gaatcgtcgg ccgtcgacag cggcacggca 6480 

40 acggcctctc ctgaccagcc ctccgacgac ggcgacgcgg gatccgacgt tgagtcgtac 6540 

tcctccatgc ccccccttga gggggagccg ggggatcccg atctcagcga cgggtcttgg 6600 
tctaccgtaa gcgaggaggc tagtgaggac gtcgtctgct gctcgatgtc ctacacatgg 6660 

acaggcgccc tgatcacgcc atgcgctgcg gaggaaacca agctgcccat caatgcactg 6720 

agcaactctt tgctccgtca ccacaacttg gtctatgcta caacatctcg cagcgcaagc 6780 

ctgcggcaga agaaggtcac ctttgacaga ctgcaggtcc tggacgacca ctaccgggac 6840 

gtgctcaagg agatgaaggc gaaggcgtcc acagttaagg ctaaacttct atccgtggag 6900 

45 gaagcctgta agctgacgcc cccacattcg gccagatcta aatttggcta tggggcaaag 6960 

gacgtccgga acctatccag caaggccgtt aaccacatcc gctccgtgtg gaaggacttg 7020 

ctggaagaca ctgagacacc aattgacacc accatcatgg caaaaaatga ggttttctgc 7080 

gtccaaccag agaagggggg ccgcaagcca gctcgcctta tcgtattccc agatttgggg 7140 

gttcgtgtgt gcgagaaaat ggccctttac gatgtggtct ccaccctccc tcaggccgtg 7200 

atgggctctt catacggatt ccaatactct cctggacagc gggtcgagtt cctggtgaat 7260 

50 gcctggaaag cgaagaaatg ccctatgggc ttcgcatatg acacccgctg ttttgactca 7320 

acggtcactg agaatgacat ccgtgttgag gagtcaatct accaatgttg tgacttggcc 7380 

cccgaagcca gacaggccat aaggtcgctc acagagcggc tttacatcgg gggccccctg 74 40 

actaattcta aagggcagaa ctgcggctat cgccggtgcc gcgcgagcgg tgtactgacg 7500 
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accagctgcg gtaataccct cacatgttac 
aagctccagg actgcacgat gctcgtatgc 
gcggggaccc aagaggacga ggcgagccta 
tctgcccccc ctggggaccc gcccaaacca 
tcctccaatg tgtcagtcgc gcacgatgca 
gaccccacca ccccccttgc gcgggctgcg 
tcctggctag gcaacatcat catgtatgcg 
actcatttct tctccatcct tctagctcag 
atctacgggg cctgttactc cattgagcca 
catggcctta gcgcattttc actccatagt 
tcatgcctca ggaaacttgg ggtaccgccc 
gtccgcgcta ggctactgtc ccaggggggg 
aactgggcag taaggaccaa gctcaaactc 
ttatccagct ggttcgttgc tggttacagc 
gcccgacccc gctggttcat gtggtgccta 
ctactcccca accgatgaac ggggagctaa 
tttccctttt tttttttctt tttttttttt 
tttttcctct ttttttcctt ttctttcctt 
tagctgtgaa aggtccgtga gccgcttgac 
agatcaagt 



ttgaaggccg ctgcggcctg tcgagctgcg 7560 
ggagacgacc ttgtcgttat ctgtgaaagc 7620 
cgggccttca cggaggctat gactagatac 7680 
gaatacgact tggagttgat aacatcatgc 7740 
tctggcaaaa gggtgtacta tctcacccgt 7800 
tgggagacag ctagacacac tccagtcaat 7860 
cccaccttgt gggcaaggat gatcctgatg 7920 
gaacaacttg aaaaagccct agattgtcag 7980 
cttgacctac ctcagatcat tcaacgactc 8040 
tactctccag gtgagatcaa tagggtggct 8100 
ttgcgagtct ggagacatcg ggccagaagt 8160 
agggctgcca cttgtggcaa gtacctcttc 8220 
actccaatcc cggctgcgtc ccagttggat 8280 
gggggagaca tatatcacag cctgtctcgt 8340 
ctcctacttt ctgtaggggt aggcatctat 8400 
acactccagg ccaataggcc atcctgtttt 8460 
tttttttttt tttttttttt ttctcctttt 8520 
tggtggctcc atcttagccc tagtcacggc 8580 
tgcagagagt gctgatactg gcctctctgc 8640 

8649 
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<210> 6 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 



<400> 6 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

tgcatcatca 

gtctccaccg 

tatcatggtg 

accaatgtgg 

ccatgcacct 

gtgcgccggc 

aagggctctt 

gctgccgtgt 

gaaaccacta 

acattccagg 

gctgcgtatg 

ctaggtttcg 

gtagggacca 

gacggtggtt 

gactcgacca 

cgactcgtcg 

atcgaggagg 

atcgcgacca 

gagctcgccg 

gatgtatccg 

acgggcttta 

gtcgacttca 

gtgtcacgct 

gtgactccag 

gacgcgggct 

tacctaaaca 

tttacaggcc 

aacttcccct 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatggcgcc 
ctagcctcac 
caacacaatc 
ccggctcaaa 
accaggacct 
gcggcagctc 
ggggcgacag 
cgggcggtcc 
gcacccgagg 
tgcggtcccc 
tggcccatct 
cagcccaagg 
gggcgtatat 
tcaccacggg 
gctctggggg 
ctatcctggg 
tgctcgccac 
tggctctgtc 
tcaagggggg 
cgaagctatc 
tcataccaac 
ccggcgattt 
gcctggaccc 
cgcagcggcg 
gagaacggcc 
gtgcttggta 
caccagggct 
tcacccacat 
acctggtagc 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
tattacggcc 
aggccgggac 
tttcctggcg 
gacccttgcc 
cgtcggctgg 
ggacctttac 
cagggggagc 
actgctctgc 
ggttgcgaag 
ggtcttcacg 
acacgcccct 
gtataaggtg 
gtctaaggca 
tgcccccatc 
cgcctatgac 
catcggcaca 
cgctacgcct 
cagcactgga 
gaggcacctc 
cggcctcgga 
tagcggagac 
cgactcagtg 
gaccttcacc 
aggcaggact 
ctcgggcatg 
cgagctcacg 
gcccgtctgc 
agacgcccat 
ataccaggct 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accacgggga 
tactcccaac 
aggaaccagg 
acctgcgtca 
ggcccaaagg 
caagcgcccc 
ttggtcacga 
ctactctccc 
ccctcggggc 
gcggtggact 
gacaactcgt 
actggtagcg 
cttgtcctga 
catggtatcg 
acgtactcca 
atcataatat 
gtcctggacc 
ccgggatcgg 
gaaatcccct 
attttctgcc 
ctcaatgctg 
gtcaf'-gtcg 
atcgactgca 
attgagacga 
ggtaggggca 
ttcgattcct 
cccgccgaga 
caggaccatc 
ttcttgtccc 
acggtgtgcg 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
agacgcgagg 
tcgaggggga 
atggcgtgtg 
gcccaatcac 
ccggggcgcg 
ggcatgccga 
ccaggcccgt 
atgctgtggg 
ttgtacccgt 
cccctccggc 
gcaagagcac 
acccgtccgt 
accctaacat 
cctatggcaa 
gtgatgagtg 
aagcggagac 
tcaccgtgcc 
tttatggcaa 
attccaagaa 
tagcatatta 
tagcaacgga 
atacatgtgt 
cgaccgtgec 
ggatgggcat 
cggttctgtg 
cctcagttag 
tggagttctg 
agactaggca 
ccagggctca 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gcgcggctat 
actgaagcgg 
tctcaccttg 
acgcttgatc 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
acccgtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
cctacttggc 
ggtccaagtg 
ttggactgtc 
ccaaatgtac 
ttccttgaca 
tgtcattccg 
ctcctacttg 
catctttcgg 
cgagtctatg 
cgtaccgcag 
taaggtgccg 
cgccgccacc 
cagaaccggg 
gtttcttgcc 
ccactcaact 
ggctggagcg 
acatccaaac 
agccatcccc 
gaaatgtgat 
ccggggcctt 
cgctctaatg 
cacccagaca 
acaagacgcg 
ttacaggttt 
cgagtgctat 
gttgcgggct 
ggagagcgtc 
ggcaggagac 
ggctccacct 



60 

120 
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600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 
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1440 
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1560 

1620 
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1740 
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1920 

1980 

2040 

2100 
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2220 

2280 
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2400 

2460 

2520 
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2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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ccatcgtggg accaaatgtg ggagtgtctc atacggctaa agcctacgct gcacgggcca 3600 
acgcccctgc tgtataggct gggagccgtt caaaacgagg ttactaccac acaccccata 3660 
accaaataca tcatggcatg catgtcggct gacctggagg tcgtcacgag cacctgggtg 3720 
ctggtaggcg gagtcctagc agctctggcc gcgtattgcc tgacaacagg cagcgtggtc 3780 

5 attgtgggca ggatcatctt gtccggaaag ccggccatca ttcccgacag ggaagtcctt 384 0 

taccgggagt tcgatgagat ggaagagtgc gcctcacacc tcccttacat cgaacaggga 3900 
atgcagctcg ccgaacaatt caaacagaag gcaatcgggt tgctgcaaac agccaccaag 3960 
caagcggagg ctgctgctcc cgtggtggaa tccaagtggc ggaccctcga agccttctgg 4020 
gcgaagcata tgtggaattt catcagcggg atacaatatt tagcaggctt gtccactctg 4 08 0 
cctggcaacc ccgcgatagc atcactgatg gcattcacag cctctatcac cagcccgctc 414 0 

10 accacccaac ataccctcct gtttaacatc ctggggggat gggtggccgc ccaacttgct 4200 

cctcccagcg ctgcttctgc tttcgtaggc gccggcatcg ctggagcggc tgttggcagc 4260 
ataggccttg ggaaggtgct tgtggatatt ttggcaggtt atggagcagg ggtggcaggc 432 0 
gcgctcgtgg cctttaaggt catgagcggc gagatgccct ccaccgagga cctggttaac 4380 
ctactccctg ctatcctctc ccctggcgcc ctagtcgtcg gggtcgtgtg cgcagcgata 4440 
ctgcgtcggc acgtgggccc aggggagggg gctgtgcagt ggatgaaccg gctgatageg 4500 
ttcgcttcgc ggggtaacca cgtctccccc acgcactatg tgtctgagag cgacgctgca 4560 

15 gcacgtgtca ctcagatcct ctctagtctt accatcactc agctgctgaa gaggcttcac 462 0 

cagtggatca acgaggactg ctccacgcca tgctccggct cgtggctaag agatgtttgg 468 0 
gattggatat gcacggtgtt gactgatttc aagacctggc tccagtccaa gctcctgccg 474 0 
cgattgccgg gagtcccctt cttctcatgt caacgtgggt acaagggagt ctggcggggc 4800 
gacggcatca tgcaaaccac ctgcccatgt ggagcacaga tcaccggaca tgtgaaaaac 4860 
ggttccatga ggatcgtggg gcctaggacc tgtagtaaca cgtggcatgg aacattcccc 4920 

20 attaacgcgt acaccacggg cccctgcacg ccctccccgg cgccaaatta ttctagggcg 4 98 0 

ctgtggcggg tggctgctga ggagtacgtg gaggttacgc gggtggggga tttccactac 5040 
gtgacgggca tgaccactga caacgtaaag tgcccgtgtc aggttccggc ccccgaattc 5100 
ttcacagaag tggatggggt gcggttgcac aggtacgctc cagcgtgcaa acccctccta 5160 
cgggaggagg tcacattcct ggtcgggctc aatcaatacc tggttgggtc acagctccca 5220 
tgcgggcccg aaccggacgt agcagtgctc acttccatgc tcaccgaccc ctcccacatt 5280 
acggcggaga cggctaagcg taggctggcc aggggatctc ccccctcctt ggccagctca 5340 

25 tcagctagcc agctgtctgc gccttccttg aaggcaacat gcactacccg tcatgactcc 5400 

ccggacgctg acctcatcga ggccaacctc ctgtggcggc aggagatggg cgggaacatc 5460 
acccgcgtgg agtcagaaaa taaggtagta attttggact ctttcgagcc gctccaagcg 5520 
gaggaggatg agagggaagt atccgttccg gcggagatcc tgcggaggtc caggaaattc 5580 
cctcgagcga tgcccatatg ggcacgcccg gattacaacc ctccactgtt agagtcctgg 5640 
aaggacccgg actacgtccc tccagtggta cacgggtgtc cattgccgcc tgccaaggcc 5700 

30 cctccgatac cacctccacg gagggagagg acggttgtcc tgtcagaatc taccgtgtct 5760 

tctgccttgg cggagctcgc cacaaagacc ttcggcagct ccgaatcgtc ggccgtcgac 5820 
agcggcacgg caacggcctc tcctgaccag ccctccgacg acggcgacgc gggatccgac 5880 
gttgagtcgt actcctccat gccccccctt gagggggagc cgggggatcc cgatctcagc 5940 
gacgggtctt ggtctaccgt aagcgaggag gctagtgagg acgtcgtctg ctgctcgatg 6000 
tcctacacat ggacaggcgc cctgatcacg ccatgcgctg cggaggaaac caagctgccc 6060 
gtcaatgcac tgagcaactc tttgctccgt caccacaact tggtctatgc tacaacatct 6120 

35 cgcagcgcaa gcctgcggca gaagaaggtc acctttgaca gactgcaggt cctggacgac 6180 

cactaccggg acgtgctcaa ggagatgaag gcgaaggcgt ccacagttaa ggctaaactt 624 0 
ctatccgtgg aggaagcctg taagctgacg cccccacatt cggccagatc taaatttggc 6300 
tatggggcaa aggacgtccg gaacctatcc agcaaggccg ttaaccacat ccgctccgtg 6360 
tggaaggact tgctggaaga cactgagaca ccaattgaca ccaccatcat ggcaaaaaat 6420 
gaggttttct gcgtccaacc agagaagggg ggccgcaagc cagctcgcct tatcgtattc 6480 

40 ccagatttgg gggttcgtgt gtgcgagaaa atggcccttt acgatgtggt ctccaccctc 6540 

cctcaggccg tgatgggctc ttcatacgga ttccaatact ctcctggaca gcgggtcgag 6600 
ttcctggtga atgcctggaa agcgaagaaa tgccctatgg gcttcgcata tgacacccgc 6660 
tgttttgact caacggtcac tgagaatgac atccgtgttg aggagtcaat ctaccaatgt 6720 
tgtgacttgg cccccgaagc cagacaggcc ataaggtcgc tcacagagcg gctttacatc 6780 
gggggccccc tgactaattc taaagggcag aactgcggct atcgccggtg ccgcgcgagc 68 40 
ggtgtactga cgaccagctg cggtaatacc ctcacatgtt atttgaaggc cgctgcggcc 6900 

45 tgtcgagctg cgaagctcca ggactgcacg atgctcgtat gcggagacga ccttgtcgtt 6960 

atctgtgaaa gcgcggggac ccaagaggac gaggcgagcc tacgggcctt cacggaggct 7020 
atgactagat actctgcccc ccctggggac ccgcccaaac cagaatacga cttggagttg 7080 
ataacatcat gctcctccaa tgtgtcagtc gcgcacgatg catctggcaa aagggtgtac 7140 
tatctcaccc gtgaccccac cacccccctt gcgcgggctg cgtgggagac agctagacac 7200 
actccagtca attcctggct aggcaacatc atcatgtatg cgcccacctt gtgggcaagg 7260 

50 atgatcctga tgactcattt cttctccatc cttctagctc aggaacaact tgaaaaagcc 7320 

ctagattgtc agatctacgg ggcctgttac tccattgagc cacttgacct acctcagatc 7380 
attcaacgac tccatggcct tagcgcattt tcactccata gttactctcc aggtgagatc 7440 
aatagggtgg cttcatgcct caggaaactt ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 
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<210> 7 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 

5 

<400> 7 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 

10 gcgagactgc tagccgagta gtgttgggtc 

gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc ggtgccctga 

15 cgtggctggc cacgacgggc gttccttgcg 

gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcatgg 

20 actgtggccg gctgggtgtg gcggaccgct 

ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 

25 acgagcattc ctaggggtct ttcccctctc 

gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 

30 cacgataata ccatgggcac gaatcctaaa 

cgccgcccac aggacgtcaa gttcccgggc 
ttgccgcgca ggggccccag gttgggtgtg 
caacctcgtg gaaggcgaca acctatcccc 
gctcagcccg ggtacccctg gcccctctat 
ctcctgtcac cccgtggctc tcggcctagt 

35 cgcaatttgg gtaaggtcat cgataccctc 

attccgctcg tcggcgcccc cctagggggc 
gttctggagg acggcgtgaa ctatgcaaca 
ttccttttgg ctttgctgtc ctgtttgacc 
gtatccggag tgtaccatgt cacgaacgac 
gcggacatga tcatgcatac ccccgggtgc 
cgctgctggg tagcgctcac tcccacgctc 

40 acgatacgac gccatgtcga tttgctcgtt 

gtgggagatc tctgcggatc tgttttcctc 
cggcacgaga cagtacagga ctgcaattgc 
cgtatggctt gggatatgat gatgaactgg 
ttactccgga tcccacaagc tgtcgtggat 
gcgggccttg cctactattc catggtgggg 

45 ctctttgccg gcgttgacgg gggaacctat 

ctcgggatta cgtccctctt ttcacccggg 
aacggcagct ggcacatcaa caggactgcc 
ttccttgctg cgctgttcta cgtgcacaag 
gccagctgca gccccatcga cgcgttcgct 
tcacacagct cggaccagag gccttattgt 

50 gtacccgcgg cgcaggtgtg tggtccagtg 

gggacgaccg accggttcgg cgtccctacg 
ctgcttctta acaacacgcg gccgccgcaa 
agcactgggt tcaccaagac gtgcgggggc 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgcccce 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 480 
ggctgtcagc gcaggggcgc ccggttcttt 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgcg gcggctgcat acgcttgatc 780 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaecc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 108 0 
accgcttcct cgtgctttac ggtatcgccg 114 0 
gccttcttga cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt 132 0 
agggcccgga aaectggccc tgtcttcttg 1380 
gccaaaggaa tgcaaggtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgctttac atgtgtttag 174 0 
accacgggga cgtggttttc ctttgaaaaa 1800 
cctcaaagaa aaaccaaacg taacaccaac 1860 
ggtggtcaga tcgtcggtgg agtttacctg 1920 
cgcgcgacta ggaagacttc cgagcggtcg 1980 
aaggctcgcc agcccgaggg tagggcctgg 2 04 0 
ggcaatgagg gcttggggtg ggcaggatgg 2100 
tggggcccca cggacccccg gcgtaggtcg 2160 
acgtgcggct tcgccgatct catggggtac 2220 
gctgccaggg ccctggcgca tggcgtccgg 2280 
gggaatctgc ccggttgctc cttttctatc 2340 
atcccagctt ccgcttatga agtgcgcaac 2400 
tgctccaacg caagcattgt gtatgaggca 2460 
gtgccctgcg ttcgggagaa caactcctcc 2520 
gcggccagga acgctagcgt ccccactacg 2580 
ggggcggctg ctctctgctc cgctatgtac 2640 
gtcgcccagc tgttcacctt ctcgcctcgc 2700 
tcaatatatc ccggccacgt gacaggtcac 2760 
tcacctacag cagccctagt ggtatcgcag 282 0 
atggtggcgg gggcccattg gggagtccta 2880 
aactgggcta aggttctgat tgtgatgcta 2940 
gtgacagggg ggacgatggc caaaaacacc 3000 
tcatcccaga aaatccagct tgtaaacacc 3060 
ctgaactgca atgactccct caacactggg 3120 
ttcaactcat ctggatgccc agagcgcatg 3180 
caggggtggg ggcccatcac ttacaatgag 324 0 
tggcactacg caccccggcc gtgcggtatc 3300 
tactgcttca ccccaagccc tgtcgtggtg 3360 
tacagttggg gggagaatga gacggacgtg 342 0 
ggcaactggt ttggctgtac atggatgaat 3480 
cccccgtgta acatcggggg gatcggcaat 354 0 
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aaaaccttga cctgccccac ggactgcttc cggaagcacc ccgaggccac ttacaccaag 3600 
tgtggttcgg ggccttggtt gacacccaga tgcttggtcc actacccata caggctttgg 3660 
cactacccct gcactgtcaa ctttaccatc ttcaaggtta ggatgtacgt ggggggagtg 3720 
gagcacaggc tcgaagccgc atgcaattgg actcgaggag agcgttgtaa cctggaggac 37 80 
agggacagat cagagcttag cccgctgctg ctgtctacaa cggagtggca ggtattgccc 3840 
tgttccttca ccaccctacc ggctctgtcc actggtttga tccatctcca tcagaacgtc 3900 
gtggacgtac aatacctgta cggtataggg tcggcggttg tctcctttgc aatcaaatgg 3960 
gagtatgtcc tgttgctctt ccttcttctg gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 
atgatgctgc tgatagctca agctgaggcc gccctagaga acctggtggt cctcaacgcg 4080 
gcatccgtgg ccggggcgca tggcattctc tccttcctcg tgttcttctg tgctgcctgg 4140 
tacatcaagg gcaggctggt ccctggggcg gcatatgccc tctacggcgt atggccgcta 4200 
ctcctgct.cc tgctggcgtt accaccacga gcatacgcca tggaccggga gatggcagca 4260 
tcgtgcggag gcgcggtttt cgtaggtctg atactcttga ccttgtcacc gcactataag 4320 
ctgttcctcg ctaggctcat atggtggtta caatatttta tcaccagggc cgaggcacac 4380 
ttgcaagtgt ggatcccccc cctcaacgtt cgggggggcc gcgatgccgt catcctcctc 4440 
acgtgcgcga tccacccaga gctaatcttt accatcacca aaatcttgct cgccatactc 4500 
ggtccactca tggtgctcca ggctggtata accaaagtgc cgtacttcgt gcgcgcacac 4560 
gggctcattc gtgcatgcat gctggtgcgg aaggttgctg ggggtcatta tgtccaaatg 4620 
gctctcatga agttggccgc actgacaggt acgtacgttt atgaccatct caccccactg 4680 
cgggactggg cccacgcggg cctacgagac cttgcggtgg cagttgagcc cgtcgtcttc 4740 
tctgatatgg agaccaaggt tatcacctgg ggggcagaca ccgcggcgtg tggggacatc 4800 
atcttgggcc tgcccgtctc cgcccgcagg gggagggaga tacatctggg accggcagac 4 860 
agccttgaag ggcaggggtg gcgactcctc gcgcctatta cggcctactc ccaacagacg 4920 
cgaggcctac ttggctgcat catcactagc ctcacaggcc gggacaggaa ccaggtcgag 4 980 
ggggaggtcc aagtggtctc caccgcaaca caatctttcc tggcgacctg cgtcaatggc 5040 
gtgtgttgga ctgtctatca tggtgccggc tcaaagaccc ttgccggccc aaagggccca 5100 
atcacccaaa tgtacaccaa tgtggaccag gacctcgtcg gctggcaagc gccccccggg 5160 
gcgcgttcct tgacaccatg cacctgcggc agctcggacc tttacttggt cacgaggcat 5220 
gccgatgtca ttccggtgcg ccggcggggc gacagcaggg ggagcctact ctcccccagg 5280 
cccgtctcct acttgaaggg ctcttcgggc ggtccactgc tctgcccctc ggggcatgct 5340 
gtgggcatct ttcgggctgc cgtgtgcacc cgaggggttg cgaaggcggt ggactttgta 54 00 
cccgtcgagt ctatggaaac cactatgcgg tccccggtct tcacggacaa ctcgtcccct 5460 
ccggccgtac cgcagacatt ccaggtggcc catctacacg cccctactgg tagcggcaag 5520 
agcactaagg tgccggctgc gtatgcagcc caagggtata aggtgcttgt cctgaacccg 5580 
tccgtcgccg ccaccctagg tttcggggcg tatatgtcta aggcacatgg tatcgaccct 5640 
aacatcagaa ccggggtagg gaccatcacc acgggtgccc ccatcacgta ctccacctat 5700 
ggcaagtttc ttgccgacgg tggttgctct gggggcgcct atgacatcat aatatgtgat 5760 
gagtgccact caactgactc gaccactatc ctgggcatcg gcacagtcct ggaccaagcg 5820 
gagacggctg gagcgcgact cgtcgtgctc gccaccgcta cgcctccggg atcggtcacc 58 BO 
gtgccacatc caaacatcga ggaggtggct ctgfcccagca ctggagaaat ccccttttat 5940 
ggcaaagcca tccccatcgc gaccatcaag ggggggaggc acctcatttt ctgccattcc 6000 
aagaagaaat gtgatgagct cgccgcgaag ctatccggcc tcggactcaa tgctgtagca 6060 
tattaccggg gccttgatgt atccgtcata ccaactagcg gagacgtcat tgtcgtagca 6120 
acggacgctc taatgacggg ctttaccggc gatttcgact cagtgatcga ctgcaataca 61 BO 
tgtgtcaccc agacagtcga cttcagcctg gacccgacct tcaccattga gacgacgacc 6240 
gtgccacaag acgcggtgtc acgctcgcag cggcgaggca ggactggtag gggcaggatg 6300 
ggcatttaca ggtttgtgac tccaggagaa cggccctcgg gcatgttcga ttcctcggtt 6360 
ctgtgcgagt gctatgacgc gggctgtgct tggtacgagc tcacgcccgc cgagacctca 6420 
gttaggttgc gggcttacct aaacacacca gggctgcccg tctgccagga ccatctggag 64 BO 
ttctgggaga gcgtctttac aggcctcacc cacatagacg cccatttctt gtcccagact 6540 
aggcaggcag gagacaactt cccctacctg gtagcatacc aggctacggt gtgcgccagg 6600 
gctcaggctc cacctccatc gtgggaccaa atgtgggagt gtctcatacg gctaaagcct 6660 
acgctgcacg ggccaacgcc cctgctgtat aggctgggag ccgttcaaaa cgaggttact 6720 
accacacacc ccataaccaa atacatcatg gcatgcatgt cggctgacct ggaggtcgtc 6780 
acgagcacct gggtgctggt aggcggagtc ctagcagctc tggccgcgta ttgcctgaca 6840 
acaggcagcg tggtcattgt gggcaggatc atcttgtccg gaaagccggc catcattccc 6900 
gacagggaag tcctttaccg ggagttcgat gagatggaag agtgcgcctc acacctccct 6960 
tacatcgaac agggaatgca gctcgccgai* caattcaaac agaaggcaat cgggttgctg 7020 
caaacagcca ccaagcaagc ggaggctgct gctcccgtgg tggaatccaa gtggcggacc 7080 
ctcgaagcct tctgggcgaa gcatatgtgg aatttcatca gcgggataca atatttagca 7140 
ggcttgtcca ctctgcctgg caaccccgcg atagcatcac tgatggcatt cacagcctct 7200 
atcaccagcc cgctcaccac ccaacatacc ctcctgttta acatcctggg gggatgggtg 7260 
gccgcccaac ttgctcctcc cagcgctgct tctgctttcg taggcgccgg catcgctgga 7 320 
gcggctgttg gcagcatagg ccttgggaag gtgcttgtgg atattttggc aggttatgga 7380 
gcaggggtgg caggcgcgct cgtggccttt aaggtcatga gcggcgagat gccctccacc 7440 
gaggacctgg ttaacctact ccctgctatc ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag 
aaccggctga 
gagagcgacg 
ctgaagaggc 
ctaagagatg 
tccaagctcc 
ggagtctggc 
ggacatgtga 
catggaacat 
aattattcta 
ggggatttcc 
ccggcccccg 
tgcaaacccc 
gggtcacagc 
gacccctccc 
tccttggcca 
acccgtcatg 
atgggcggga 
gagccgctcc 
aggtccagga 
ctgttagagt 
ccgcctgcca 
gaatctaccg 
tcgtcggccg 
gacgcgggat 
gatcccgatc 
gtctgctgct 
gaaaccaagc 
tatgctacaa 
caggtcctgg 
gttaaggcta 
agatctaaat 
cacatccgct 
atcatggcaa 
cgccttatcg 
gtggtctcca 
ggacagcggg 
gcatatgaca 
tcaatctacc 
gagcggcttt 
cggtgccgcg 
aaggccgctg 
gacgaccttg 
gccttcacgg 
tacgacttgg 
ggcaaaaggg 
gagacagcta 
accttgtggg 
caacttgaaa 
gacctacctc 
tctccaggtg 
cgagtctgga 
gctgccactt 
ccaatcccgg 
ggagacatat 
ctactttctg 
ctccaggcca 
tttttttttt 
tggctccatc 
agagagtgct 



cgatactgcg 
tagcgttcgc 
ctgcagcacg 
ttcaccagtg 
tttgggattg 
tgccgcgatt 
ggggcgacgg 
aaaacggttc 
tccccattaa 
gggcgctgtg 
actacgtgac 
aattcttcac 
tcctacggga 
tcccatgcgg 
acattacggc 
gctcatcagc 
actccccgga 
acatcacccg 
aagcggagga 
aattccctcg 
cctggaagga 
aggcccctcc 
tgtcttctgc 
tcgacagcgg 
ccgacgttga 
tcagcgacgg 
cgatgtccta 
tgcccgtcaa 
catctcgcag 
acgaccacta 
aacttctatc 
ttggctatgg 
ccgtgtggaa 
aaaatgaggt 
tattcccaga 
ccctccctca 
tcgagttcct 
cccgctgttt 
aatgttgtga 
acatcggggg 
cgagcggtgt 
cggcctgtcg 
tcgttatctg 
aggctatgac 
agttgataac 
tgtactatct 
gacacactcc 
caaggatgat 
aagccctaga 
agatcattca 
agatcaatag 
gacatcgggc 
gtggcaagta 
ctgcgtccca 
atcacagcct 
taggggtagg 
ataggccatc 
tttttttttc 
ttagccctag 
gatactggcc 



tcggcacgtg 
ttcgcggggt 
tgtcactcag 
gatcaacgag 
gatatgcacg 
gccgggagtc 
catcatgcaa 
catgaggatc 
cgcgtacacc 
gcgggtggct 
gggcatgacc 
agaagtggat 
ggaggtcaca 
gcccgaaccg 
ggagacggct 
tagccagctg 
cgctgacctc 
cgtggagtca 
ggatgagagg 
agcgatgccc 
cccggactac 
gataccacct 
cttggcggag 
cacggcaacg 
gtcgtactcc 
gtcttggtct 
cacatggaca 
tgcactgagc 
cgcaagcctg 
ccgggacgtg 
cgtggaggaa 
ggcaaaggac 
ggacttgctg 
tttctgcgtc 
tttgggggtt 
ggccgtgatg 
ggtgaatgcc 
tgactcaacg 
cttggccccc 
ccccctgact 
actgacgacc 
agctgcgaag 
tgaaagcgcg 
tagatactct 
atcatgctcc 
cacccgtgac 
agtcaattcc 
cctgatgact 
ttgtcagatc 
acgactccat 
ggtggcttca 
cagaagtgtc 
cctcttcaac 
gttggattta 
gtctcgtgcc 
catctatcta 
ctgttttttt 
tccttttttt 
tcacggctag 
tctctgcaga 



ggcccagggg 
aaccacgtct 
atcctctcta 
gactgctcca 
gtgttgactg 
cccttcttct 
accacctgcc 
gtggggccta 
acgggcccct 
gctgaggagt 
actgacaacg 
ggggtgcggt 
ttcctggtcg 
gacgtagcag 
aagcgtaggc 
tctgcgcctt 
atcgaggcca 
gaaaataagg 
gaagtatccg 
atatgggcac 
gtccctccag 
ccacggaggg 
ctcgccacaa 
gcctctcctg 
tccatgcccc 
accgtaagcg 
ggcgccctga 
aactctttgc 
cggcagaaga 
ctcaaggaga 
gcctgtaagc 
gtccggaacc 
gaagacactg 
caaccagaga 
cgtgtgtgcg 
ggctcttcat 
tggaaagcga 
gtcactgaga 
gaagccagac 
aattctaaag 
agctgcggta 
ctccaggact 
gggacccaag 
gccccccctg 
tccaatgtgt 
cccaccaccc 
tggctaggca 
catttcttct 
tacggggcct 
ggccttagcg 
tgcctcagga 
cgcgctaggc 
tgggcagtaa 
tccagctggt 
cgaccccgct 
ctccccaacc 
cccttttttt 
ttcctctttt 
ctgtgaaagg 
tcaagt 



agggggctgt 
cccccacgca 
gtcttaccat 
cgccatgctc 
atttcaagac 
catgtcaacg 
catgtggagc 
ggacctgtag 
gcacgccctc 
acgtggaggt 
taaagtgccc 
tgcacaggta 
ggctcaatca 
tgctcacttc 
tggccagggg 
ccttgaaggc 
acctcctgtg 
tagtaatttt 
ttccggcgga 
gcccggatta 
tggtacacgg 
agaggacggt 
agaccttcgg 
accagccctc 
cccttgaggg 
aggaggctag 
tcacgccatg 
tccgt caeca 
aggtcacctt 
tgaaggcgaa 
tgacgccccc 
tatccagcaa 
agacaccaat 
aggggggecg 
agaaaatggc 
aeggattcca 
agaaatgece 
atgacatccg 
aggecataag 
ggcagaactg 
ataccctcac 
geacgatget 
aggacgaggc 
gggacccgcc 
cagtcgcgca 
cccttgcgcg 
acatcatcat 
ccatccttct 
gttactccat 
cattttcact 
aacttggggt 
tactgtccca 
ggaccaagct 
tcgttgctgg 
ggttcatgtg 
gatgaaeggg 
ttttcttttt 
tttccttttc 
tccgtgagcc 



gcagtggatg 
ctatgtgtct 
cactcagctg 
cggctcgtgg 
ctggctccag 
tgggtacaag 
acagatcacc 
taacacgtgg 
cccggcgcca 
tacgegggtg 
gtgtcaggtt 
cgctccagcg 
atacctggtt 
catgctcacc 
atctcccccc 
aacatgeact 
geggcaggag 
ggactctttc 
gatcctgegg 
caaccctcca 
gtgtccattg 
tgtcctgtca 
cagctccgaa 
cgacgacggc 
ggagccgggg 
tgaggacgtc 
egctgeggag 
caacttggtc 
tgacagactg 
ggcgtccaca 
acattcggcc 
ggccgttaac 
tgacaccacc 
caagccagct 
cctttacgat 
atactctcct 
tatgggcttc 
tgttgaggag 
gtcgctcaca 
cggctatcgc 
atgttatttg 
cgtatgcgga 
gagectaegg 
caaaccagaa 
egatgeatet 
ggctgcgtgg 
gtatgcgccc 
agctcaggaa 
tgagecaett 
ccatagttac 
accgcccttg 
gggggggagg 
caaactcact 
ttacagcggg 
gtgcctactc 
gagctaaaca 
tttttttttt 
tttcctttgg 
gettgactge 



7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 

8520 

8580 

8640 

8700 

8760 

8820 

8880 

8940 

9000 

9060 

9120 

9180 

9240 

9300 

9360 

9420 

9480 

9540 

9600 

9660 

9720 

9780 

9840 

9900 

9960 

10020 

10080 

10140 

10200 

10260 

10320 

10380 

10440 

10500 

10560 

10620 

10680 

10740 

10800 

10860 

10920 

10980 

11040 

11076 
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<210> 8 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 
<400> 8 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggcfcgeat acgcttgatc 7 80 
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 840 
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 
cagaccacaa cggtttccct ctagcgggat caattccgcc cctctccctc ccccccccct 1260 
aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 
tccaccatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 
acgagcattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 
tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 
taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1660 
gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 
tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 
cacgataata ccatggcgcc tattacggcc tactcccaac agacgcgagg cctacttggc 1860 
tgcatcatca ctagcctcac aggccgggac aggaaccagg tcgaggggga ggtccaagtg 1920 
gtctccaccg caacacaatc tttcctggcg acctgcgtca atggcgtgtg ttggactgtc 1980 
tatcatggtg ccggctcaaa gacccttgcc ggcccaaagg gcccaatcac ccaaatgtac 2040 
accaatgtgg accaggacct cgtcggctgg caagcgcccc ccggggcgcg ttccttgaca 2100 
ccatgcacct gcggcagctc ggacctttac ttggtcacga ggcatgccga tgtcattccg 2160 
gtgcgccggc ggggcgacag cagggggagc ctactctccc ccaggcccgt ctcctacttg 2220 
aagggctctt cgggcggtcc actgctctgc ccctcggggc acgctgtggg catctttcgg 2280 
gctgccgtgt gcacccgagg ggttgcgaag gcggtggact ttgtacccgt cgagtctatg 2340 
gaaaccacta tgcggtcccc ggtcttcacg gacaactcgt cccctccggc cgtaccgcag 2400 
acattccagg tggcccatct acacgcccct actggtagcg gcaagagcac taaggtgccg 2460 
gctgcgtatg cagcccaagg gtataaggtg cttgtcctga acccgtccgt cgccgccacc 2520 
ctaggtttcg gggcgtatat gtctaaggca catggtatcg accctaacat cagaatcggg 2580 
gtaaggacca tcaccacggg tgcccccatc acgtactcca cctatggcaa gtttcttgcc 264 0 
gacggtggtt gctctggggg cgcctatgac atcataatat gtgatgagtg ccactcaact 2700 
gactcgacca ctatcctggg catcggcaca gtcctggacc aagcggagac ggctggagcg 2760 
cgactcgtcg tgctcgccac cgctacgcct ccgggatcgg tcaccgtgcc acatccaaac 2820 
atcgaggagg tggctctgtc cagcactgga gaaatcccct tttatggcaa agccatcccc 2880 
atcgagacca tcaagggggg gaggcacctc attttctgcc attccaagaa gaaatgtgat 294 0 
gagctcgccg cgaagctgtc cggcctcgga ctcaatgctg tagcatatta ccggggcctt 3000 
gatgtatccg tcataccaac Aagcggagac gtcattgtcg tagcaacgga cgctctaatg 3060 
acgggcttta ccggtgactt cgactcagtg atcgactgca atacatgtgt cacccagaca 3120 
gtcgacttca gcctggaccc gaccttcacc attgagacga cgaccgtgcc acaagacgcg 3180 
gtgtcacgct cgcagcggcg aggcaggact ggtaggggca ggatgggcat ttacaggttt 3240 
gtgactccag gagaacggcc ctcgggcatg ttcgattcct cggttctgtg cgagtgctat 3300 
gacgcgggct gtgcttggta cgagctcacg cccgccgaga cctcagttag gttgcgggct 3360 
tacctaaaca caccagggtt gcccgtctgc caggaccatc tggagttctg ggagagcgtc 3420 
tttacaggcc tcacccacat agacgcccat ttcttgtccc agactaagca ggcaggagac 3480 
aacttcccct acctggtagc ataccaggct acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg 
acgcccctgc 
accaaataca 
ctggtaggcg 
attgtgggca 
taccgggagt 
atgcagctcg 
caagcggagg 
gcgaagcata 
cctggcaacc 
accacccaac 
cctcccagcg 
ataggccttg 
gcgctcgtgg 
ctactccctg 
ctgcgtcggc 
ttcgcttcgc 
gcacgtgtca 
cagtggatca 
gattggatat 
cgattgccgg 
gacggcatca 
ggttccatga 
attaacgcgt 
ctgtggcggg 
gtgacgggca 
ttcacagaag 
cgggaggagg 
tgcgagcccg 
acggcggaga 
tcagctagcc 
ccggacgctg 
acccgcgtgg 
gaggaggatg 
cctcgagcga 
aaggacccgg 
cctccgatac 
tctgccttgg 
agcggcacgg 
gttgagtcgt 
gacgggtctt 
tcctacacat 
atcaatgcac 
cgcagcgcaa 
cactaccggg 
ctatccgtgg 
tatggggcaa 
tggaaggact 
gaggttttct 
ccagatttgg 
cctcaggccg 
ttcctggtga 
tgttttgact 
tgtgacttgg 
gggggccccc 
ggtgtactga 
tgtcgagctg 
atctgtgaaa 
atgactagat 
ataacatcat 
tatctcaccc 
actccagtca 
atgatcctga 
ctagattgtc 
attcaacgac 
aatagggtgg 



accaaatgtg 
tgtataggct 
tcatggcatg 
gagtcctagc 
ggatcatctt 
tcgatgagat 
ccgaacaatt 
ctgctgctcc 
tgtggaattt 
ccgcgatagc 
ataccctcct 
ctgcttctgc 
ggaaggtgct 
cctttaaggt 
ctatcctctc 
acgtgggccc 
ggggtaacca 
ctcagatcct 
acgaggactg 
gcacggtgtt 
gagtcccctt 
tgcaaaccac 
ggatcgtggg 
acaccacggg 
tggctgctga 
tgaccactga 
tggatggggt 
tcacattcct 
aaccggatgt 
cggctaagcg 
agctgtctgc 
acctcatcga 
agtcagaaaa 
agagggaagt 
tgcccatatg 
actacgtccc 
caccttcacg 
cggagctcgc 
caacggcctc 
actcctccat 
ggtctaccgt 
ggacaggcgc 
tgagcaactc 
gcctgcggca 
acgtgctcaa 
aggaagcctg 
aggacgtccg 
tgctggaaga 
gcgtccaacc 
gggttcgtgt 
tgatgggctc 
atgcctggaa 
caacggtcac 
cccccgaagc 
tgactaattc 
cgaccagctg 
cgaagctcca 
gcgcggggac 
actctgcccc 
gctcctccaa 
gtgaccccac 
attcctggct 
tgactcattt 
agatctacgg 
tccatggcct 
cttcatgcct 



gaagtgtctc 
gggagccgtt 
catgtcggct 
agctctggcc 
gtccggaaag 
ggaagagtgc 
caaacagaag 
cgtggtggaa 
catcagcggg 
atcactgatg 
gtttaacatc 
tttcgtaggc 
tgtggatatt 
catgagcggc 
ccctggcgcc 
aggggagggg 
cgtctccccc 
ctctagtctt 
ctccacgcca 
gactgatttc 
cttctcatgt 
ctgcccatgt 
gcctaggacc 
cccctgcacg 
ggagtacgtg 
cgacgtaaag 
gcggttgcac 
ggtcgggctc 
agcagtgctc 
taggctggcc 
gccttccttg 
ggccaacctc 
taaggtagta 
atccgttccg 
ggcacgcccg 
tccagtggta 
gaggaagagg 
cacagagacc 
tcctgaccag 
gccccccctt 
aagcgaggag 
cctgatcacg 
tttgctccgt 
gaagaaggtc 
ggagatgaag 
taagctgacg 
gaacctatcc 
cactgagaca 
agagaagggg 
gtgcgagaaa 
ttcatacgga 
agcgaagaaa 
tgagaatgac 
cagacaggcc 
taaagggcag 
cggtaatacc 
ggactgcacg 
ccaagaggac 
ccctggggac 
tgtgtcagtc 
cacccccctt 
aggcaacatc 
cttctccatc 
ggcctgttac 
tagcgcattt 
caggaaactt 



atacggctaa 
caaaacgagg 
gacctggagg 
gcgtattgcc 
ccggccatca 
gcctcacacc 
gcaatcgggt 
tccaagtggc 
atacaatatt 
gcattcacag 
ctggggggat 
gccggcatcg 
ttggcaggtt 
gagatgccct 
ctagtcgtcg 
gctgtgcagt 
acgcactatg 
accatcactc 
tgctccggct 
aagacctggc 
caacgtgggt 
ggggcacaga 
tgtagtaaca 
ccctccccgg 
gaggttacgc 
tgcccgtgtc 
aggtacgctc 
aatcaatacc 
acttccatgc 
aggggatctc 
aaggcaacat 
ctgtggcggc 
attttggact 
gcggagatcc 
gattacaacc 
cacgggtgtc 
acggttgtcc 
ttcggcagct 
ccctccgacg 
gagggggagc 
gctagtgagg 
ccatgcgctg 
caccacaact 
acctttgaca 
gcgaaggcgt 
cccccacatt 
agcaaggccg 
ccaattgaca 
ggccgcaagc 
atggcccttt 
ttccaatact 
tgccctatgg 
atccgtgttg 
ataaggtcgc 
aactgcggct 
ctcacatgtt 
atgctcgtat 
gaggcgagcc 
ccgcccaaac 
gcgcacgatg 
gcgcgggctg 
atcatgtatg 
cttctagctc 
tccattgagc 
tcactccata 
ggggtaccgc 



agcctacgct 
ttactaccac 
tcgtcacgag 
tgacaacagg 
ttcccgacag 
tcccttacat 
tgctgcaaac 
ggaccatcga 
tagcaggctt 
cctctatcac 
gggtggccgc 
ctggagcggc 
atggagcagg 
ccaccgagga 
gggtcgtgtg 
ggatgaaccg 
tgcctgagag 
agctgctgaa 
cgtggctaag 
tccagtccaa 
acaagggagt 
tcaccggaca 
cgtggcatgg 
cgccaaatta 
gggtggggga 
aggttccggc 
cagcgtgcaa 
tggttgggtc 
tcaccgaccc 
ctcccccctt 
gcactacccg 
aggagatggg 
ctttcgagcc 
tgcggaggtc 
ctccactgtt 
cattgccgcc 
tgtcagaatc 
ccgaatcgtc 
acggcgacgc 
cgggggatcc 
acgtcgtctg 
cggaggaaac 
tggtctatgc 
gactgcaggt 
ccacagttaa 
cggccagatc 
ttaaccacat 
ccaccatcat 
cagctcgcct 
acgatgtggt 
ctcctggaca 
gcttcgcata 
aggagtcaat 
tcacagagcg 
atcgccggtg 
acttgaaggc 
gcggagacga 
tacgggcctt 
cagaatacga 
catctggcaa 
cgtgggagac 
cgcccacctt 
aggaacaact 
cacttgacct 
gttactctcc 
ccttgcgagt 



gcacgggcca 
acaccccata 
cacctgggtg 
cagcgtggtc 
ggaagtcctt 
cgaacaggga 
agccaccaag 
agccttctgg 
gtccactctg 
cagcccgctc 
ccaacttgct 
tgttggcagc 
ggtggcaggc 
cctggttaac 
cgcagcgata 
gctgatagcg 
cgacgctgca 
gaggcttcac 
agatgtttgg 
gctcctgccg 
ctggcggggc 
tgtgaaaaac 
aacattcccc 
ttctagggcg 
tttccactac 
ccccgaattc 
acccctccta 
acagctccca 
ctcccacatt 
ggccagctca 
tcatgactcc 
cgggaacatc 
gctccaagcg 
caggaaattc 
agagtcctgg 
tgccaaggcc 
taccgtgtct 
ggccgtcgac 
gggatccgac 
cgatctcagc 
ctgctcgatg 
caagctgccc 
tacaacatct 
cctggacgac 
ggctaaactt 
taaatttggc 
ccgctccgtg 
ggcaaaaaat 
tatcgtattc 
ctccaccctc 
gcgggtcgag 
tgacacccgc 
ctaccaatgt 
gctttacatc 
ccgcgcgagc 
cgctgcggcc 
ccttgtcgtt 
eacggaggct 
cttggagttg 
aagggtgtac 
agctagacac 
gtgggcaagg 
tgaaaaagcc 
acctcagatc 
aggtgagatc 
ctggagacat 



3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 

8001 
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<210> 9 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 



<400> 9 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

cgccgcccac 

ttgccgcgca 

caaccccgtg 

gctcagcccg 

ctcctgtcac 

cgcaatttgg 

attccgctcg 

gttctggagg 

ttccttttgg 

gtatccggag 

gcggacatga 

cgctgctggg 

acgatacgac 

gtgggagatc 

cggcacgaga 

cgtatggctt 

ttactccgga 

gcgggccttg 

ctctttgccg 

ctcgggatta 

aacggcagct 

ttccttgctg 

gccagctgca 

tcacacagct 

gtacccgcgg 

gggacgaccg 

ctgcttctta 

agcactgggt 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatgggcac 
aggacgtcaa 
ggggccccag 
gaaggcgaca 
ggtacccctg 
cccgtggctc 
gtaaggtcat 
tcggcgcccc 
acggcgtgaa 
ctttgctgtc 
tgtaccatgt 
tcatgcatac 
tagcgctcac 
gccatgtcga 
tctgcggatc 
cagtacagga 
gggatatgat 
tcccacaagc 
cctactattc 
gcgttgacgg 
cgtccctctt 
ggcacatcaa 
cgctgttcta 
gccccatcga 
cggaccagag 
cgcaggtgtg 
accggttcgg 
acaacacgcg 
tcaccaagac 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
gaatcctaaa 
gttcccgggc 
gttgggtgtg 
acctatcccc 
gcccctctat 
tcggcctagt 
cgataccctc 
cctagggggc 
ctatgcaaca 
ctgtttgacc 
cacgaacgac 
ccccgggtgc 
tcccacgctc 
tttgctcgtt 
tgttttcctc 
ctgcaattgc 
gatgaactgg 
tgtcgtggat 
catggtgggg 
gggaacctat 
ttcacccggg 
caggactgcc 
cgtgcacaag 
cgcgttcgct 
gccttattgt 
tggtccagtg 
cgtccctacg 
gccgccgcaa 
gtgcgggggc 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accacgggga 
cctcaaagaa 
ggtggtcaga 
cgcgcgacta 
aaggctcgcc 
ggcaatgagg 
tggggcccca 
acgtgcggct 
gctgccaggg 
gggaatctgc 
atcccagctt 
tgctccaacg 
gtgccctgcg 
gcggccagga 
ggggcggctg 
gtcgcccagc 
tcaatatatc 
tcacctacag 
atggtggcgg 
aactgggcta 
gtgacagggg 
tcatcccaga 
ctgaactgca 
ttcaactcat 
caggggtggg 
tggcactacg 
tactgcttca 
tacagttggg 
ggcaactggt 
cccccgtgta 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
aaaccaaacg 
tcgtcggtgg 
ggaagacttc 
agcccgaggg 
gcttggggtg 
cggacccccg 
tcgccgatct 
ccctggcgca 
ccggttgctc 
ccgcttatga 
caagcattgt 
ttcgggagaa 
acgctagcgt 
ctctctgctc 
tgttcacctt 
ccggccacgt 
cagccctagt 
gggcccattg 
aggttctgat 
ggacgatggc 
aaatccagct 
atgactccct 
ctggatgccc 
ggcccatcac 
caccccggcc 
ccccaagccc 
gggagaatga 
ttggctgtac 
acatcggggg 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gcgcggctat 
actgaagcgg 
tctcaccttg 
acgcttgatc 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
acccgtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
taacaccaac 
agtttacctg 
cgagcggtcg 
tagggcctgg 
ggcaggatgg 
gcgtaggtcg 
catggggtac 
tggcgtccgg 
cttttctatc 
agtgcgcaac 
gtatgaggca 
caactcctcc 
ccccactacg 
cgctatgtac 
ctcgcctcgc 
gacaggtcac 
ggtatcgcag 
gggagtccta 
tgtgatgcta 
caaaaacacc 
tgtaaacacc 
caacactggg 
agagcgcatg 
ttacaatgag 
gtgcggtatc 
tgtcgtggtg 
gacggacgtg 
atggatgaat 
gatcggcaat 
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aaaaccttga cctgccccac ggactgcttc cggaagcacc ccgaggccac ttacaccaag 3600 

tgtggtfccgg ggccttggtt gacacccaga tgcttggtcc actacccata caggctttgg 3660 

cactacccct gcactgtcaa ctttaccatc ttcaaggtta ggatgtacgt ggggggagtg 3720 

gagcacaggc tcgaagccgc atgcaattgg actcgaggag agcgttgtaa cctggaggac 3780 

5 agggacagat cagagcttag cccgctgctg ctgtctacaa cggagtggca ggtattgccc 3840 

tgttccttca ccaccctacc ggctctgtcc actggtttga tccatctcca tcagaacgtc 3900 

gtggacgtac aatacctgta cggtataggg tcggcggttg tctcctttgc aatcaaatgg 3960 

gagtatgtcc tgttgctctt ccttcttctg gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 

atgatgctgc tgatagctca agctgaggcc gccctagaga acctggtggt cctcaacgcg 4080 

gcatccgtgg ccggggcgca tggcattctc tccttcctcg tgttcttctg tgctgcctgg 4140 

10 tacatcaagg gcaggctggt ccctggggcg gcatatgccc tctacggcgt atggccgcta 4200 

ctcctgctcc tgctggcgtt accaccacga gcatacgcca tggaccggga gatggcagca 4260 

tcgtgcggag gcgcggtttt cgtaggtctg atactcttga ccttgtcacc gcactataag 4320 

ctgttcctcg ctaggctcat atggtggtta caatatttta tcaccagggc cgaggcacac 4380 

ttgcaagtgt ggatcccccc cctcaacgtt cgggggggcc gcgatgccgt catcctcctc 4440 

acgtgcgcga tccacccaga gctaatcttt accatcacca aaatcttgct cgccatactc 4500 

ggtccactca tggtgctcca ggctggtata accaaagtgc cgtacttcgt gcgcgcacac 4560 

15 gggctcattc gtgcatgcat gctggtgcgg aaggttgctg ggggtcatta tgtccaaatg 4620 

gctctcatga agttggccgc actgacaggt acgtacgttt atgaccatct caccccactg 4680 

cgggactggg cccacgcggg cctacgagac cttgcggtgg cagttgagcc cgtcgtcttc 4740 

tctgatatgg agaccaaggt tatcacctgg ggggcagaca ccgcggcgtg tggggacatc 4800 

atcttgggcc tgcccgtctc cgcccgcagg gggagggaga tacatctggg accggcagac 4860 

agccttgaag ggcaggggtg gcgactcctc gcgcctatta cggcctactc ccaacagacg 4920 

20 cgaggcctac ttggctgcat catcactagc ctcacaggcc gggacaggaa ccaggtcgag 49 80 

ggggaggtcc aagtggtctc caccgcaaca caatctttcc tggcgacctg cgtcaatggc 5040 

gtgtgttgga ctgtctatca tggtgccggc tcaaagaccc ttgccggccc aaagggccca 5100 

atcacccaaa tgtacaccaa tgtggaccag gacctcgtcg gctggcaagc gccccccggg 5160 

gcgcgttcct tgacaccatg cacctgcggc agctcggacc tttacttggt cacgaggcat 5220 

gccgatgtca ttccggtgcg ccggcggggc gacagcaggg ggagcctact ctcccccagg 5280 

cccgtctcct acttgaaggg ctcttcgggc ggtccactgc tctgcccctc ggggcacgct 5340 

25 gtgggcatct ttcgggctgc cgtgtgcacc cgaggggttg cgaaggcggt ggactttgta 5400 

cccgtcgagt ctatggaaac cactatgcgg tccccggtct tcacggacaa ctcgtcccct 5460 

ccggccgtac cgcagacatt ccaggtggcc catctacacg cccctactgg tagcggcaag 5520 

agcactaagg tgccggctgc gtatgcagcc caagggtata aggtgcttgt cctgaacccg 5580 

tccgtcgccg ccaccctagg tttcggggcg tatatgtcta aggcacatgg tatcgaccct 5640 

aacatcagaa tcggggtaag gaccatcacc acgggtgccc ccatcacgta ctccacctat 5700 

30 ggcaagtttc ttgccgacgg tggttgctct gggggcgcct atgacatcat aatatgtgat 5760 

gagtgccact caactgactc gaccactatc ctgggcatcg gcacagtcct ggaccaagcg 5820 

gagacggctg gagcgcgact cgtcgtgctc gccaccgcta cgcctccggg atcggtcacc 5880 

gtgccacatc caaacatcga ggaggtggct ctgtccagca ctggagaaat ccccttttat 5940 

ggcaaagcca tccccatcga gaccatcaag ggggggaggc acctcatttt ctgccattcc 6000 

aagaagaaat gtgatgagct cgccgcgaag ctgtccggcc tcggactcaa tgctgtagca 6060 

tattaccggg gccttgatgt atccgtcata ccaactagcg gagacgtcat tgtcgtagca 6120 

35 acggacgctc taatgacggg ctttaccggt gacttcgact cagtgatcga ctgcaataca 6180 

tgtgtcaccc agacagtcga cttcagcctg gacccgacct tcaccattga gacgacgacc 6240 

gtgccacaag acgcggtgtc acgctcgcag cggcgaggca ggactggtag gggcaggatg 6300 

ggcatttaca ggtttgtgac tccaggagaa cggccctcgg gcatgttcga ttcctcggtt 6360 

ctgtgcgagt gctatgacgc gggctgtgct tggtacgagc tcacgcccgc cgagacctca 6420 

gttaggttgc gggcttacct aaacacacca gggttgcccg tctgccagga ccatctggag 6480 

40 ttctgggaga gcgtctttac aggcctcacc cacatagacg cccatttctt gtcccagact 6540 

aagcaggcag gagacaactt cccctacctg gtagcatacc aggctacggt gtgcgccagg 6600 

gctcaggctc cacctccatc gtgggaccaa atgtggaagt gtctcatacg gctaaagcct 6660 

acgctgcacg ggccaacgcc cctgctgtat aggctgggag ccgttcaaaa cgaggttact 6720 

accacacacc ccataaccaa atacatcatg gcatgcatgt cggctgacct ggaggtcgtc 6780 

acgagcacct gggtgctggt aggcggagtc ctagcagctc tggccgcgta ttgcctgaca 6840 

acaggcagcg tggtcattgt gggcaggatc atcttgtccg gaaagccggc catcattccc 6900 

45 gacagggaag tcctttaccg ggagttcgat gagatggaag agtgcgcctc acacctccct 6960 

tacatcgaac agggaatgca gctcgccgaa caattcaaac agaaggcaat cgggttgctg 7020 

caaacagcca ccaagcaagc ggaggctgct gctcccgtgg tggaatccaa gtggcggacc 7080 

atcgaagcct tctgggcgaa gcatatgtgg aatttcatca gcgggataca atatttagca 7140 

ggcttgtcca ctctgcctgg caaccccgcg atagcatcac tgatggcatt cacagcctct 7200 

atcaccagcc cgctcaccac ccaacatacc ctcctgttta acatcctggg gggatgggtg 7260 

SO gccgcccaac ttgctcctcc cagcgctgct tctgctttcg taggcgccgg catcgctgga 7320 

gcggctgttg gcagcatagg ccttgggaag gtgcttgtgg atattttggc aggttatgga 7380 

gcaggggtgg caggcgcgct cgtggccttt aaggtcatga gcggcgagat gccctccacc 7440 

gaggacctgg ttaacctact ccctgctatc ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag cgatactgcg tcggcacgtg ggcccagggg agggggctgt gcagtggatg 7560 
aaccggctga tagcgttcgc ttcgcggggt aaccacgtct cccccacgca ctatgtgcct 7620 
gagagcgacg ctgcagcacg tgtcactcag atcctctcta gtcttaccat cactcagctg 7680 
ctgaagaggc ttcaccagtg gatcaacgag gactgctcca cgccatgctc cggctcgtgg 7740 
ctaagagatg tttgggattg gatatgcacg gtgttgactg atttcaagac ctggctccag 7800 
tccaagctcc tgccgcgatt gccgggagtc cccttcttct catgtcaacg tgggtacaag 7860 
ggagtctggc ggggcgacgg catcatgcaa accacctgcc catgtggggc acagatcacc 7920 
ggacatgtga aaaacggttc catgaggatc gtggggccta ggacctgtag taacacgtgg 7980 
catggaacat tccccattaa cgcgtacacc acgggcccct gcacgccctc cccggcgcca 8040 
aattattcta gggcgctgtg gcgggtggct gctgaggagt acgtggaggt tacgcgggtg 8100 
ggggatttcc actacgtgac gggcatgacc actgacgacg taaagtgccc gtgtcaggtt 8160 
ccggcccccg aattcttcac agaagtggat ggggtgcggt tgcacaggta cgctccagcg 8220 
tgcaaacccc tcctacggga ggaggtcaca ttcctggtcg ggctcaatca atacctggtt 8280 
gggtcacagc tcccatgcga gcccgaaccg gatgtagcag tgctcacttc catgctcacc 8340 
gacccctccc acattacggc ggagacggct aagcgtaggc tggccagggg atctcctccc 8400 
cccttggcca gctcatcagc tagccagctg tctgcgcctt ccttgaaggc aacatgcact 8460 
acccgtcatg actccccgga cgctgacctc atcgaggcca acctcctgtg gcggcaggag 8520 
atgggcggga acatcacccg cgtggagtca gaaaataagg tagtaatttt ggactctttc 8580 
gagccgctcc aagcggagga ggatgagagg gaagtatccg ttccggcgga gatcctgcgg 8640 
aggtccagga aattcccfccg agcgatgccc atatgggcac gcccggatta caaccctcca 8700 
ctgttagagt cctggaagga cccggactac gtccctccag tggtacacgg gtgtccattg 8760 
ccgcctgcca aggcccctcc gataccacct tcacggagga agaggacggt tgtcctgtca 8820 
gaatctaccg tgtcttctgc cttggcggag ctcgccacag agaccttcgg cagctccgaa 8880 
tcgtcggccg tcgacagcgg cacggcaacg gcctctcctg accagccctc cgacgacggc 8940 
gacgcgggat ccgacgttga gtcgtactcc tccatgcccc cccttgaggg ggagccgggg 9000 
gatcccgatc tcagcgacgg gtcttggtct accgtaagcg aggaggctag tgaggacgtc 9060 
gtctgctgct cgatgtccta cacatggaca ggcgccctga tcacgccatg cgctgcggag 9120 
gaaaccaagc tgcccatcaa tgcactgagc aactctttgc tccgtcacca caacttggtc 9180 
tatgctacaa catctcgcag cgcaagcctg cggcagaaga aggtcacctt tgacagactg 9240 
caggtcctgg acgaccacta ccgggacgtg ctcaaggaga tgaaggcgaa ggcgtccaca 9300 
gttaaggcta aacttctatc cgtggaggaa gcctgtaagc tgacgccccc acattcggcc 9360 
agatctaaat ttggctatgg ggcaaaggac gtccggaacc tatccagcaa ggccgttaac 9420 
cacatccgct ccgtgtggaa ggacttgctg gaagacactg agacaccaat tgacaccacc 9480 
atcatggcaa aaaatgaggt tttctgcgtc caaccagaga aggggggccg caagccagct 954 0 
cgccttatcg tattcccaga tttgggggtt cgtgtgtgcg agaaaatggc cctttacgat 9600 
gtggtctcca ccctccctca ggccgtgatg ggctcttcat acggattcca atactctcct 9660 
ggacagcggg tcgagttcct ggtgaatgcc tggaaagcga agaaatgccc tatgggcttc 9720 
gcatatgaca cccgctgttt tgactcaacg gtcactgaga atgacatccg tgttgaggag 9780 
tcaatctacc aatgttgtga cttggccccc gaagccagac aggccataag gtcgctcaca 9840 
gagcggcttt acatcggggg ccccctgact aattctaaag ggcagaactg cggctatcgc 9900 
cggtgccgcg cgagcggtgt actgacgacc agctgcggta ataccctcac atgttacttg 9960 
aaggccgctg cggcctgtcg agctgcgaag ctccaggact gcacgatgct cgtatgcgga 10020 
gacgaccttg tcgttatctg tgaaagcgcg gggacccaag aggacgaggc gagcctacgg 10080 
gccttcacgg aggctatgac tagatactct gccccccctg gggacccgcc caaaccagaa 10140 
tacgacttgg agttgataac atcatgctcc tccaatgtgt cagtcgcgca cgatgcatct 10200 
ggcaaaaggg tgtactatct cacccgtgac cccaccaccc cccttgcgcg ggctgcgtgg 10260 
gagacagcta gacacactcc agtcaattcc tggctaggca acatcatcat gtatgcgccc 10320 
accttgtggg caaggatgat cctgatgact catttcttct ccatccttct agctcaggaa 10380 
caacttgaaa aagccctaga ttgtcagatc tacggggcct gttactccat tgagccactt 10440 
gacctacctc agatcattca acgactccat ggccttagcg cattttcact ccatagttac 10500 
tctccaggtg agatcaatag ggtggcttca tgcctcagga aacttggggt accgcccttg 10560 
cgagtctgga gacatcgggc cagaagtgtc cgcgctaggc tactgtccca gggggggagg 10620 
gctgccactt gtggcaagta cctcttcaac tgggcagtaa ggaccaagct caaactcact 10680 
ccaatcccgg ctgcgtccca gttggattta tccagctggt tcgttgctgg ttacagcggg 10740 
ggagacatat atcacagcct gtctcgtgcc cgaccccgct ggttcatgtg gtgcctactc 10800 
ctactttctg taggggtagg catctatcta ctccccaacc gatgaacggg gagctaaaca 10860 
ctccaggcca ataggccatc ctgttttttt cccttttttt ttttcttttt tttttttttt 10920 
tttttttttt tttttttttc tccttttttt ttcctctttt tttccttttc tttcctttgg 10980 
tggctccatc ttagccctag tcacggctag ctgtgaaagg tccgtgagcc gcttgactgc 11040 
agagagtgct gatactggcc tctctgcaga tcaagt 11076 
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<210> 10 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 
<400> 10 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gateaacccg ctcaatgcct ggagatttgg gcgtgcccee 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 4 80 
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 780 
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 840 
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 
cagaccacaa cggtttccct ctagcgggat caattccgcc cctctccctc ccccccccct 1260 
aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 
tccaccatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 
acgagcattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 
tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 
taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 
gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 
tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 
cacgataata ccatggcgcc tattacggcc tactcccaac agacgcgagg cctacttggc 1860 
tgcatcatca ctagcctcac aggccgggac aggaaccagg tcgaggggga ggtccaagtg 1920 
gtctccaccg caacacaatc tttcctggcg acctgcgtca atggcgtgtg ttggactgtc 1980 
tatcatggtg ccggctcaaa gacccttgcc ggcccaaagg gcccaatcac ccaaatgtac 2040 
accaatgtgg accaggacct cgtcggctgg caagcgcccc ccggggcgcg ttccttgaca 2100 
ccatgcacct gcggcagctc ggacctttac ttggtcacga ggcatgccga tgtcattccg 2160 
gtgcgccggc ggggcgacag cagggggagc ctactctccc ccaggcccgt ctcctacttg 2220 
aagggctctt egggcggtcc actgctctgc ccctcggggc acgctgtggg catctttcgg 2280 
gctgccgtgt gcacccgagg ggttgcgaag gcggtggact ttgtacccgt cgagtctatg 2340 
ggaaccacta tgcggtcccc ggtcttcacg gacaactcgt cccctccggc cgtaccgcag 2400 
acattccagg tggcccatct acacgcccct actggtagcg gcaagagcac taaggtgccg 2460 
gctgcgtatg caggccaagg gtataaggtg cttgtcctga acccgtccgt cgccgccacc 252 0 
ctaggtttcg gggcgtatat gtctaaggca catggtatcg accctaacat cagaatcggg 2580 
gtaaggacca tcaccacggg tgcccccatc acgtactcca cctatggcaa gtttcttgcc 2640 
gacggtggtt gctctggggg cgcctatgac atcataatat gtgatgagtg ccactcaact 2700 
gactcgacca ctatcctggg catcggcaca gtcctggacc aagcggagac ggctggagcg 2760 
cgactcgtcg tgctcgccac cgctacgcct ccgggatcgg tcaccgtgcc acatccaaac 2820 
atcgaggagg tggctctgtc cagcactgga gaaatcccct tttatggcaa agccatcccc 2880 
atcgagacca tcaagggggg gaggcacctc attttctgcc attccaagaa gaaatgtgat 2940 
gagctcgccg cgaagctgtc cggcctcgga ctcaatgctg tagcatatta ccggggcctt 3000 
gatgtatccg tcatacc<*ac tagcggagac gtcattgtcg tagcaacgga cgctctaatg 3060 
acgggcttta ccggcgactt cgactcagtg atcgactgca atacatgtgt cacccagaca 3120 
gtcgacttca gcctggaccc gaccttcacc attgagacga cgaccgtgcc acaagacgcg 3180 
gtgtcacgct cgcagcggcg aggcaggact ggtaggggca ggatgggcat ttacaggttt 3240 
gtgactccag gagaacggcc ctcgggcatg ttcgattcct cggttctgtg cgagtgctat 3300 
gacgcgggct gtgcttggta cgagctcacg cccgccgaga cctcagttag gttgcgggct 3360 
tacctaaaca caccagggtt gcccgtctgc caggaccatc tggagttctg ggagagcgtc 3420 
tttacaggcc tcacccacat agacgcccat ttcttgtccc agactaagca ggcaggagac 3480 
aacttcccct acctggtagc ataccaggct acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg accaaatgtg gaagtgtctc 
acgcccctgc tgtataggct gggagccgtt 
accaaataca tcatggcatg catgtcggct 
ctggtaggcg gagtcctagc agctctggcc 
attgtgggca ggatcatctt gtccggaaag 
taccgggagt tcgatgagat ggaagagtgc 
atgcagctcg ccgaacaatt caaacagaag 
caagcggagg ctgctgctcc cgtggtggaa 
gcgaagcata tgtggaattt catcagcggg 
cctggcaacc ccgcgatagc atcactgatg 
accacccaac ataccctcct gtttaacatc 
cctcccagcg ctgcttctgc tttcgtaggc 
ataggccttg ggaaggtgct tgtggatatt 
gcgctcgtgg cctttaaggt catgagcggc 
ctactccctg ctatcctctc ccctggcgcc 
ctgcgtcggc acgtgggccc aggggagggg 
ttcgcttcgc ggggtaacca cgtctccccc 
gcacgagtca ctcagatcct ctctagtctt 
cagtggatca acgaggactg ctccacgcca 
gattggatat gcacggtgtt gactgatttc 
cgattgccgg gagtcccctt cttctcatgt 
gacggcatca tgcaaaccac ctgcccatgt 
ggttccatga ggatcgtggg gcctaggacc 
attaacgcgt acaccacggg cccctgcacg 
ctgtggcggg taggtgctga ggagtacgtg 
gtgacgggca tgaccactga caacgtaaag 
ttcacagaag tggatggggt gcggttgcac 
cgggaggagg tcacattcct ggtcgggctc 
tgcgagcctg aaccggatgt agcagtgctc 
acggcggaga cggctaagcg taggctggcc 
tcagctagcc agctgtctgc gccttccttg 
ccggacgctg acctcatcga ggccaacctc 
acccgcgtgg agtcagaaaa taaggtagta 
gaggaggatg agaggggagt atccgttccg 
cctcgagcga tgcccatatg ggcacgcccg 
aaggacccgg actacgtccc tccagtggta 
cctccgatac caccttcacg gaggaagagg 
tctgccttgg cggagctcgc cacagagacc 
agcggcacgg caacggcctc tcctgaccag 
gttgagtcgt actcctccat gccccccctt 
gacgggtctt ggtctaccgt aagcgaggag 
tcctacacat ggacaggcgc cctgatcacg 
atcaatgcac tgagcaactc tttgctccgt 
cgcagcgcaa acctgcggca gaagaaggtc 
cactaccggg acgtgctcaa ggagatgaag 
ctatccgtgg aggaagcctg taagctgacg 
tatggggcaa aggacgtccg gaacctatcc 
tggaaggact tgctggaaga cactgagaca 
gaggttttct gcgtccaacc agagaagggg 
ccagatttgg gggttcgtgt gtgcgagaaa 
cctcaggccg tgatgggctc ttcatacgga 
ttcctggtga atgcctggaa agcgaagaaa 
tgttttgact caacggtcac tgagaatgac 
tgtgacttgg cccccgaagc cagacaggcc 
gggggccccc tgactaattc taaagggcag 
ggtgtactga cgaccagctg cggtaatacc 
tgtcgagctg cgaagctcca ggactgcacg 
atctgtgaaa gcgcggggac ccaagaggac 
atgactagat actctgcccc ccctggggac 
ataacatcat gctcctccaa tgtgtcagtc 
tatctcaccc gtgaccccac cacccccctt 
actccagtca attcctggct aggcaacatc 
atgatcctga tgactcattt cttctccatc 
ctagattgtc agatctacgg ggcctgttac 
attcaacgac tccatggcct tagcgcattt 
aatagggtgg cttcatgcct caggaaactt 



atacggctaa agcctacgct gcacgggcca 3600 
caaaacgagg ttactaccac acaccccata 3660 
gacctggagg tcgtcacgag cacctgggtg 3720 
gcgtattgcc tgacaacagg cagcgtggtc 3780 
ccggccatca ttcccgacag ggaagtcctt 3840 
gcctcacacc tcccttacat cgaacaggga 3900 
gcaatcgggt tgctgcaaac agccaccaag 3960 
tccaagtggc ggaccatcga agccttctgg 4020 
atacaatatt tagcaggctt gtccactctg 4080 
gcattcacag cctctatcac cagcccgctc 4140 
ctggggggat gggtggccgc ccaacttgct 4200 
gccggcatcg ctggagcggc tgttggcagc 4260 
ttggcaggtt atggagcagg ggtggcaggc 4320 
gagttgccct ccaccgagga cctggttaac 4380 
ctagtcgtcg gggtcgtgtg cgcagcgata 44 40 
gctgtgcagt ggatgaaccg gctgatagcg 4500 
acgcactatg tgcctgagag cgacgctgca 4560 
accatcactc agctgctgaa gaggcttcac 4620 
tgctccggct cgtggctaag agatgtttgg 4680 
aagacctggc tccagtccaa gctcctgccg 4740 
caacgtgggt acaagggagt ctggcggggc 48 00 
ggagcacaga tcaccggaca tgtgaaaaac 4860 
tgtagtaaca cgtggcatgg aacattcccc 4920 
ccctccccgg cgccaaatta ttctagggcg 4980 
gaggttacgc gggtggggga tttccactac 5040 
tgcccgtgtc aggttccggc ccccgaattc 5100 
aggtacgctc cagcgtgcaa acccctccta 5160 
aatcaatacc tggttgggtc acagctccca 5220 
acttccatgc tcaccgaccc ctcccacatt 5280 
aggggatctc cccccccctt ggccagctca 5340 
aaggcaacat gcactacccg tcatgactcc 5400 
ctgtggcggc aggagatggg cgggaacatc 5460 
attttggact ctttcgagcc gctccaagcg 5520 
gcggagatcc tgcggaggtc caggaaattc 5580 
gattacaacc ctccactgtt agagtcctgg 5640 
cacgggtgtc cattgccgcc tgccaaggcc 5700 
acggttgtcc tgtcagaatc taccgtgtct 5760 
ttcggcagct ccgaatcgtc ggccgtcgac 5820 
ccctccgacg acggcgacgc gggatccgac 5880 
gagggggagc cgggggatcc cgatctcagc 5940 
gctagtgagg acgtcgtctg ctgctcgatg 6000 
ccatgcgctg cggaggaaac caagctgccc 6060 
caccacaact tggtctatgc tacaacatct 6120 
acctttgaca gactgcaggt cctggacgac 6180 
gcgaaggcgt ccacagttaa ggctaaactt 6240 
cccccacatt cggccagatc taaatttggc 6300 
agcaaggccg ttaaccacat ccgctccgtg 6360 
ccaattgaca ccaccatcat ggcaaaaaat 6420 
ggccgcaagc cagctcgcct tatcgtattc 6480 
atggcccttt acgatgtggt ctccaccctc 6540 
ttccaatact ctcctggaca gcgggtcgag 6600 
tgccctatgg gcttcgcata tgacaccegc 6660 
atccgtgttg aggagtcaat ctaccaatgt 6720 
ataaggtcgc tcacagagcg gctttacatc 6780 
aactgcggct atcgccggtg ccgcgcgagc 6840 
ctcacatgtt acttgaaggc cgctgcggcc 6900 
atgctcgtat gcggagacga ccttgtcgtt 6960 
gaggcgagcc tacgggcctt cacggaggct 7020 
ccgcccaaac cagaatacga cttggagttg 7080 
gcgcacgatg catctggcaa aagggtgtac 7140 
gcgcgggctg cgtgggagac agctagacac 7200 
atcatgtatg cgcccacctt gtgggcaagg 7260 
cttctagctc aggaacaact tgaaaaagcc 7320 
tccattgagc cacttgacct acctcagatc 7380 
tcactccata gttactctcc aggtgagatc 7440 
ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 

8001 
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<210> 11 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 



<400> 11 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

cgccgcccac 

ttgccgcgca 

caacctcgtg 

gctcagcccg 

ctcctgtcac 

cgcaatttgg 

attccgctcg 

gttctggagg 

ttccttttgg 

gtatccggag 

gcggacatga 

cgctgctggg 

acgatacgac 

gtgggagatc 

cggcacgaga 

cgtatggctt 

ttactccgga 

gcgggccttg 

ctctttgccg 

ctcgggatta 

aacggcagct 

ttccttgctg 

gccagctgca 

tcacacagct 

gtacccgcgg 

gggacgaccg 

ctgcttctta 

agcactgggt 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatgggcac 
aggacgtcaa 
ggggccccag 
gaaggcgaca 
ggtacccctg 
cccgtggctc 
gtaaggtcat 
tcggcgcccc 
acggcgtgaa 
ctttgctgtc 
tgtaccatgt 
tcatgcatac 
tagcgctcac 
gccatgtcga 
tctgcggatc 
cagtacagga 
gggatatgat 
tcccacaagc 
cctactattc 
gcgttgacgg 
cgtccctctt 
ggcacatcaa 
cgctgttcta 
gccccatcga 
cggaccagag 
cgcaggtgtg 
accggttcgg 
acaacacgcg 
tcaccaagac 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
gaatcctaaa 
gttcccgggc 
gttgggtgtg 
acctatcccc 
gcccctctat 
tcggcctagt 
cgataccctc 
cctagggggc 
ctatgcaaca 
ctgtttgacc 
cacgaacgac 
ccccgggtgc 
tcccacgctc 
tttgctcgtt 
tgttttcctc 
ctgcaattgc 
gatgaactgg 
tgtcgtggat 
catggtgggg 
gggaacctat 
ttcacccggg 
caggactgcc 
cgtgcacaag 
cgcgttcgct 
gccttattgt 
tggtccagtg 
cgtccctacg 
gccgccgcaa 
gtgcgggggc 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accacgggga 
cctcaaagaa 
ggtggtcaga 
cgcgcgacta 
aaggctcgcc 
ggcaatgagg 
tggggcccca 
acgtgcggct 
gctgccaggg 
gggaatctgc 
atcccagctt 
tgctccaacg 
gtgccctgcg 
gcggccagga 
ggggcggctg 
gtcgcccagc 
tcaatatatc 
tcacctacag 
atggtggcgg 
aactgggcta 
gtgacagggg 
tcatcccaga 
ctgaactgca 
ttcaactcat 
caggggtggg 
tggcactacg 
tactgcttca 
tacagttggg 
ggcaactggt 
cccccgtgta 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
aaaccaaacg 
tcgtcggtgg 
ggaagacttc 
agcccgaggg 
gcttggggtg 
cggacccccg 
tcgccgatct 
ccctggcgca 
ccggttgctc 
ccgcttatga 
caagcattgt 
ttcgggagaa 
acgctagcgt 
ctctctgctc 
tgttcacctt 
ccggccacgt 
cagccctagt 
gggcccattg 
aggttctgat 
ggacgatggc 
aaatccagct 
atgactccct 
ctggatgccc 
ggcccatcac 
caccccggcc 
ccccaagccc 
gggagaatga 
ttggctgtac 
acatcggggg 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gcgcggctat 
actgaagcgg 
tctcaccttg 
acgcttgatc 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
acccgtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
taacaccaac 
agtttacctg 
cgagcggtcg 
tagggcctgg 
ggcaggatgg 
gcgtaggtcg 
catggggtac 
tggcgtccgg 
cttttctatc 
agtgcgcaac 
gtatgaggca 
caactcctcc 
ccccactacg 
cgctatgtac 
ctcgcctcgc 
gacaggtcac 
ggtatcgcag 
gggagtccta 
tgtgatgcta 
caaaaacacc 
tgtaaacacc 
caacactggg 
agagcgcatg 
ttacaatgag 
gtgcggtatc 
tgtcgtggtg 
gacggacgtg 
atggatgaat 
gatcggcaat 



60 

120 

1BO 

240 

300 

360 

420 

4B0 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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aaaaccttga 
tgtggttcgg 
cactacccct 
gagcacaggc 
agggacagat 
tgttccttca 
gtggacgtac 
gagtatgtcc 
atgatgctgc 
gcatccgtgg 
tacatcaagg 
ctcctgctcc 
tcgtgcggag 
ctgttcctcg 
ttgcaagtgt 
acgtgcgcga 
ggtccactca 
gggctcattc 
gctctcatga 
cgggactggg 
tctgatatgg 
atcttgggcc 
agccttgaag 
cgaggcctac 
ggggaggtcc 
gtgtgttgga 
atcacccaaa 
gcgcgttcct 
gccgatgtca 
cccgtctcct 
gtgggcatct 
cccgtcgagt 
ccggccgtac 
agcactaagg 
tccgtcgccg 
aacatcagaa 
ggcaagtttc 
gagtgccact 
gagacggctg 
gtgccacatc 
ggcaaagcca 
aagaagaaat 
tattaccggg 
acggacgctc 
tgtgtcaccc 
gtgccacaag 
ggcatttaca 
ctgtgcgagt 
gttaggttgc 
ttctgggaga 
aagcaggcag 
gctcaggctc 
acgctgcacg 
accacacacc 
acgagcacct 
aeaggcagcg 
gacagggaag 
tacatcgaac 
caaacagcca 
atcgaagcct 
ggcttgtcca 
atcaccagcc 
gccgcccaac 
gcggctgttg 
gcaggggtgg 
gaggacctgg 



cctgccccac 
ggccttggtt 
gcactgtcaa 
tcgaagccgc 
cagagcttag 
ccaccctacc 
aatacctgta 
tgttgctctt 
tgatagctca 
ccggggcgca 
gcaggctggt 
tgctggcgtt 
gcgcggtttt 
ctaggctcat 
ggatcccccc 
tccacccaga 
tggtgctcca 
gtgcatgcat 
agttggccgc 
cccacgcggg 
agaccaaggt 
tgcccgtctc 
ggcaggggtg 
ttggctgcat 
aagtggtctc 
ctgtctatca 
tgtacaccaa 
tgacaccatg 
ttccggtgcg 
acttgaaggg 
ttcgggctgc 
ctatgggaac 
cgcagacatt 
tgccggctgc 
ccaccctagg 
tcggggtaag 
ttgccgacgg 
caactgactc 
gagcgcgact 
caaacatcga 
tccccatcga 
gtgatgagct 
gccttgatgt 
taatgacggg 
agacagtcga 
acgcggtgtc 
ggtttgtgac 
gctatgacgc 
gggcttacct 
gcgtctttac 
gagacaactt 
cacctccatc 
ggccaacgcc 
ccataaccaa 
gggtgctggt 
tggtcattgt 
tcctttaccg 
agggaatg^a 
ccaagcaagc 
tctgggcgaa 
ctctgcctgg 
cgctcaccac 
ttgctcctcc 
gcagcatagg 
caggcgcgct 
ttaacctact 



ggactgcttc 
gacacccaga 
ctttaccatc 
atgcaattgg 
cccgctgctg 
ggctctgtcc 
cggtataggg 
ccttcttctg 
agctgaggcc 
tggcattctc 
ccctggggcg 
accaccacga 
cgtaggtctg 
atggtggtta 
cctcaacgtt 
gctaatcttt 
ggctggtata 
gctggtgcgg 
actgacaggt 
cctacgagac 
tatcacctgg 
cgcccgcagg 
gcgactcctc 
catcactagc 
caccgcaaca 
tggtgccggc 
tgtggaccag 
cacctgcggc 
ccggcggggc 
ctcttcgggc 
cgtgtgcacc 
cactatgcgg 
ccaggtggcc 
gtatgcaggc 
tttcggggcg 
gaccatcacc 
tggttgctct 
gaccactatc 
cgtcgtgctc 
ggaggtggct 
gaccatcaag 
cgccgcgaag 
atccgtcata 
ctttaccggc 
cttcagcctg 
acgctcgcag 
tccaggagaa 
gggctgtgct 
aaacacacca 
aggcctcacc 
cccctacctg 
gtgggaccaa 
cctgctgtat 
atacatcatg 
aggcggagtc 
gggcaggatc 
ggagttcgat 
gctcgccgaa 
ggaggctgct 
gcatatgtgg 
caaccccgcg 
ccaacatacc 
cagcgctgct 
ccttgggaag 
cgtggccttt 
ccctgctatc 



cggaagcacc 
tgcttggtcc 
ttcaaggtta 
actcgaggag 
ctgtctacaa 
actggtttga 
tcggcggttg 
gcggacgcgc 
gccctagaga 
tccttcctcg 
gcatatgccc 
gcatacgcca 
atactcttga 
caatatttta 
cgggggggcc 
accatcacca 
accaaagtgc 
aaggttgctg 
acgtacgttt 
cttgcggtgg 
ggggcagaca 
gggagggaga 
gcgcctatta 
ctcacaggcc 
caatctttcc 
tcaaagaccc 
gacctcgtcg 
agctcggacc 
gacagcaggg 
ggtccactgc 
cgaggggttg 
tccccggtct 
catctacacg 
caagggtata 
tatatgtcta 
acgggtgccc 
gggggcgcct 
ctgggcatcg 
gccaccgcta 
ctgtccagca 
ggggggaggc 
ctgtccggcc 
ccaactagcg 
gacttcgact 
gacccgacct 
cggcgaggca 
cggccctcgg 
tggtacgagc 
gggttgcccg 
cacatagacg 
gtagcatacc 
atgtggaagt 
aggctgggag 
gcatgcatgt 
ctagcagctc 
atcttgtccg 
gagatggaag 
caattcaaac 
gctcccgtgg 
aatttcatca 
atagcatcac 
ctcctgttta 
tctgctttcg 
gtgcttgtgg 
aaggtcatga 
ctctcccctg 



ccgaggccac 
actacccata 
ggatgtacgt 
agcgttgtaa 
cggagtggca 
tccatctcca 
tctcctttgc 
gcgtctgtgc 
acctggtggt 
tgttcttctg 
tctacggcgt 
tggaccggga 
ccttgtcacc 
tcaccagggc 
gcgatgccgt 
aaatcttgct 
cgtacttcgt 
ggggtcatta 
atgaccatct 
cagttgagcc 
ccgcggcgtg 
tacatctggg 
cggcctactc 
gggacaggaa 
tggcgacctg 
ttgccggccc 
gctggcaagc 
tttacttggt 
ggagcctact 
tctgcccctc 
cgaaggcggt 
tcacggacaa 
cccctactgg 
aggtgcttgt 
aggcacatgg 
ecatcacgta 
atgacatcat 
gcacagtcct 
cgcctccggg 
ctggagaaat 
acctcatttt 
tcggactcaa 
gagacgtcat 
cagtgatcga 
tcaccattga 
ggactggtag 
gcatgttcga 
tcacgcccgc 
tctgccagga 
cccatttctt 
aggctacggt 
gtctcatacg 
ccgttcaaaa 
cggctgacct 
tggccgcgta 
gaaagccggc 
agtgcgcctc 
agaaggcaat 
tggaatccaa 
gcgggataca 
tgatggcatt 
acatcctggg 
taggcgccgg 
atattttggc 
gcggcgagtt 
gcgccctagt 



ttacaccaag 
caggctttgg 
ggggggagtg 
cctggaggac 
ggtattgccc 
tcagaacgtc 
aatcaaatgg 
ctgcttgtgg 
cctcaacgcg 
tgctgcctgg 
atggccgcta 
gatggcagca 
gcactataag 
cgaggcacac 
catcctcctc 
cgccatactc 
gcgcgcacac 
tgtccaaatg 
caccccactg 
cgtcgtcttc 
tggggacatc 
accggcagac 
ccaacagacg 
ccaggtcgag 
cgtcaatggc 
aaagggccca 
gccccccggg 
cacgaggcat 
ctcccccagg 
ggggcacgct 
ggactttgta 
ctcgtcccct 
tagcggcaag 
cctgaacccg 
tatcgaccct 
ctccacctat 
aatatgtgat 
ggaccaagcg 
atcggtcacc 
ccccttttat 
ctgccattcc 
tgctgtagca 
tgtcgtagca 
ctgcaataca 
gacgacgacc 
gggcaggatg 
ttcctcggtt 
cgagacctca 
ccatctggag 
gtcccagact 
gtgcgccagg 
gctaaagcct 
cgaggttact 
ggaggtcgtc 
ttgcctgaca 
catcattccc 
acacctccct 
cgggttgctg 
gtggcggacc 
atatttagca 
cacagcctct 
gggatgggtg 
catcgctgga 
aggttatgga 
gccctcca.cc 
cgtcggggtc 



3600 
3660 
3720 
3780 
3840 
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4080 
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4200 
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5580 
5640 
5700 
5760 
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gtgtgcgcag 
aaccggctga 
gagagcgacg 
ctgaagaggc 
ctaagagatg 
tccaagctcc 
ggagtctggc 
ggacatgtga 
catggaacat 
aattattcta 
ggggatttcc 
ccggcccccg 
tgcaaacccc 
gggtcacagc 
gacccctccc 
cccttggcca 
acccgtcatg 
atgggcggga 
gagccgctcc 
aggtccagga 
ctgttagagt 
ccgcctgcca 
gaatctaccg 
tcgtcggccg 
gacgcgggat 
gatcccgatc 
gtctgctgct 
gaaaccaagc 
tatgctacaa 
caggtcctgg 
gttaaggcta 
agatctaaat 
cacatccgct 
atcatggcaa 
cgccttatcg 
gtggtctcca 
ggacagcggg 
gcatatgaca 
tcaatctacc 
gagcggcttt 
cggtgccgcg 
aaggccgctg 
gacgaccttg 
gccttcacgg 
tacgacttgg 
gg caaa a ggg 
gagacagcta 
accttgtggg 
caacttgaaa 
gacctacctc 
tctccaggtg 
cgagtctgga 
gctgccactt 
ccaatcccgg 
ggagacatat 
ctactttctg 
ctccaggcca 
tttttttttt 
tggctccatc 
agagagtgct 



cgatactgcg 
tagcgttcgc 
ctgcagcacg 
ttcaccagtg 
tttgggattg 
tgccgcgatt 
ggggcgacgg 
aaaacggttc 
tccccattaa 
gggcgctgtg 
actacgtgac 
aattcttcac 
tcctacggga 
tcccatgcga 
acattacggc 
gctcatcagc 
actccccgga 
acatcacccg 
aagcggagga 
aattccctcg 
cctggaagga 
aggcccctcc 
tgtcttctgc 
tcgacagcgg 
ccgacgttga 
tcagcgacgg 
cgatgtccta 
tgcccatcaa 
catctcgcag 
acgaccacta 
aacttctatc 
ttggctatgg 
ccgtgtggaa 
aaaatgaggt 
tattcccaga 
ccctccctca 
tcgagttcct 
cccgctgttt 
aatgttgtga 
acatcggggg 
cgagcggtgt 
cggcctgtcg 
tcgttatctg 
aggctatgac 
agttgataac 
tgtactatct 
gacacactcc 
caaggatgat 
aagccctaga 
agatcattca 
agatcaatag 
gacatcgggc 
gtggcaagta 
ctgcgtccca 
atcacagcct 
taggggtagg 
ataggccatc 
tttttttttc 
ttagccctag 
gatactggcc 



tcggcacgtg 
ttcgcggggt 
agtcactcag 
gatcaacgag 
gatatgcacg 
gccgggagtc 
catcatgcaa 
catgaggatc 
cgcgtacacc 
gcgggtaggt 
gggcatgacc 
agaagtggat 
ggaggtcaca 
gcctgaaccg 
ggagacggct 
tagccagctg 
cgctgacctc 
cgtggagtca 
ggatgagagg 
agcgatgccc 
cccggactac 
gataccacct 
cttggcggag 
cacggcaacg 
gtcgtactcc 
gtcttggtct 
cacatggaca 
tgcactgagc 
cgcaaacctg 
ccgggacgtg 
cgtggaggaa 
ggcaaaggac 
ggacttgctg 
tttctgcgtc 
tttgggggtt 
ggccgtgatg 
ggtgaatgcc 
tgactcaacg 
cttggccccc 
ccccctgact 
actgacgacc 
agctgcgaag 
tgaaagcgcg 
tagatactct 
atcatgctcc 
cacccgtgac 
agtcaattcc 
cctgatgact 
ttgtcagatc 
acgactccat 
ggtggcttca 
cagaagtgtc 
cctcttcaac 
gttggattta 
gtctcgtgcc 
catctatcta 
ctgttttttt 
tccttttttt 
tcacggctag 
tctctgcaga 



ggcccagggg 
aaccacgtct 
atcctctcta 
gactgctcca 
gtgttgactg 
cccttcttct 
accacctgcc 
gtggggccta 
acgggcccct 
gctgaggagt 
actgacaacg 
ggggtgcggt 
ttcctggtcg 
gatgtagcag 
aagcgtaggc 
tctgcgcctt 
atcgaggcca 
gaaaataagg 
ggagtafcccg 
atatgggcac 
gtccctccag 
tcacggagga 
ctcgccacag 
gcctctcctg 
tccatgcccc 
accgtaagcg 
ggcgccctga 
aactctttgc 
cggcagaaga 
ctcaaggaga 
gcctgtaagc 
gtccggaacc 
gaagacactg 
caaccagaga 
cgtgtgtgcg 
ggctcttcat 
tggaaagcga 
gtcactgaga 
gaagccagac 
aattctaaag 
agctgcggta 
ctccaggact 
gggacccaag 
gccccccctg 
tccaatgtgt 
cccaccaccc 
tggctaggca 
catttcttct 
tacggggcct 
ggccttagcg 
tgcctcagga 
cgcgctaggc 
tgggcagtaa 
tccagctggt 
cgaccccgct 
ctccccaacc 
cccttttttt 
ttcctctttt 
ctgtgaaagg 
tcaagt 



agggggctgt 
cccccacgca 
gtcttaccat 
cgccatgctc 
atttcaagac 
catgtcaacg 
catgtggagc 
ggacctgtag 
gcacgccctc 
acgtggaggt 
taaagtgccc 
tgcacaggta 
ggctcaatca 
tgctcacttc 
tggccagggg 
ccttgaaggc 
acctcctgtg 
tagtaatttt 
ttccggcgga 
gcccggatta 
tggtacacgg 
agaggacggt 
agaccttcgg 
accagccctc 
cccttgaggg 
aggaggctag 
tcacgccatg 
tccgt caeca 
aggtcacctt 
tgaaggcgaa 
tgacgccccc 
tatccagcaa 
agacaccaat 
aggggggecg 
agaaaatggc 
aeggattcca 
agaaatgece 
atgacatccg 
aggecataag 
ggcagaactg 
ataccctcac 
geacgatget 
aggacgaggc 
gggacccgcc 
cagtcgcgca 
cccttgcgcg 
acatcatcat 
ccatccttct 
gttactccat 
cattttcact 
aacttggggt 
tactgtccca 
ggaccaagct 
tcgttgctgg 
ggttcatgtg 
gatgaaeggg 
ttttcttttt 
tttccttttc 
tccgtgagcc 



gcagtggatg 
ctatgtgcct 
cactcagctg 
cggctcgtgg 
ctggctccag 
tgggtacaag 
acagatcacc 
taacacgtgg 
cccggcgcca 
tacgegggtg 
gtgtcaggtt 
cgctccagcg 
atacctggtt 
catgctcacc 
atctcccccc 
aacatgeact 
geggcaggag 
ggactctttc 
gatcctgegg 
caaccctcca 
gtgtccattg 
tgtcctgtca 
cagctccgaa 
cgacgacggc 
ggagccgggg 
tgaggacgtc 
egctgeggag 
caacttggtc 
tgacagactg 
ggcgtccaca 
acattcggcc 
ggccgttaac 
tgacaccacc 
caagccagct 
cctttacgat 
atactctcct 
tatgggcttc 
tgttgaggag 
gtcgctcaca 
cggctatcgc 
atgttacttg 
cgtatgcgga 
gagectaegg 
caaaccagaa 
egatgeatet 
ggctgcgtgg 
gtatgcgccc 
agctcaggaa 
tgagecaett 
ccatagttac 
accgcccttg 
gggggggagg 
caaactcact 
ttacagcggg 
gtgcctactc 
gagctaaaca 
tttttttttt 
tttcctttgg 
gettgactge 



7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 
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8640 
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8940 

9000 

9060 
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9180 

9240 

9300 

9360 

9420 
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9540 
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9840 
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10020 
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10140 

10200 

10260 

10320 

10380 

10440 

10500 

10560 

10620 

10680 

10740 

10800 

10860 

10920 

10980 

11040 

11076 
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Patentanspruche 

1 . Hepatitis C Virus (HCV) Zellkultursystem, das im wesentlichen eukaryontische Zellen umfaBt, die eingeschleustes 
HCV-spezifisches Genmaterial enthalten , dadurch gekennzeichnet, 

daB die eukaryontischen Zellen humane Hepatomazellen sind und daB das eingeschleuste HCV-spezifische 
Genmaterial ein HCV-RNA-Konstrukt ist, das die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, 
NS4B, NS5A, NS5B und 3' NTR und zusatzlich ein selektierbares Markergen (Selektionsgen) umfaBt. 

2. Zellkultursystem nach Anspruch 1 , dadurch gekennzeichnet, 

daB die Hepatomazellen von einer handelsublichen Hepatomazellinie abstammen . 

3. Zellkultursystem nach Anspruch 1 , dadurch gekennzeichnet, 

daB die Hepatomazellen aus einer Hepatomaprimarzellkultur gewonnen sind. 

4. HCV-RNA-Konstrukt, dadurch gekennzeichnet, 

daB es die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR und 
zusatzlich ein selektierbares Markergen (Selektionsgen) umfaBt. 

5. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, 

daB es eine Nukleotidsequenz gemaB einem der Sequenzprotokolle SEQ ID NO: 1 bis SEQ ID NO: 1 1 umfaBt. 

6. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, 

daB die 3' NTR eine Nukleotidsequenz aufweist, die aus der Gruppe der nachfolgend aufgelisteten Nukleotid- 
sequenzen (a) bis (i) ausgewahlt ist: 

(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTTT 
TTAGCTTTTTTTTTTTTCTTTTTTTTTGAGAGAGAGAGTCTCACTCTG 
TTGCCCAGACTGGAGT 
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(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC yxnrTrnr tctttttttt tgagagagag 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA 
GAGTCTCACT CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 



7. HCV-RNA-Konslrukt nach einem der AnsprCiche 4 bis 6, dadurch gekennzeichnet, 

dal3 das selektierbare Markergen ein Resistenzgen und insbesondere eine Antibiotikaresistenzgen ist. 

8. HCV-RNA-Konstrukt nach einem der AnsprCiche 4 bis 6, dadurch gekennzeichnet, 

daft das selektierbare Markergen ein Neomycinphosphotransferasegen ist. 

9. HCV-RNA-Konstrukt nach einem der AnsprCiche 4 bis 8, dadurch gekennzeichnet, 

dal3 das selektierbare Markergen strangabwarts der 5' NTR in die HCV-RNA integriert ist. 

10. HCV-RNA-Konstrukt nach einem der AnsprCiche 4 bis 9, dadurch gekennzeichnet, 



63 



EP 1 043 399 A2 



daB das selektierbare Markergen uber ein Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV- 
RNA verbunden ist. 

11. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 10, dadurch gekennzeichnet, 

daB es ein integriertes Reportergen aufweist. 

12. HCV-RNA-Konstrukt nach Anspruch 1 1 , dadurch gekennzeichnet, 

daB das Reportergen ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloramphenicol-Acetayl- 
Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), der GFP-Gene (green-fluorescence-protein-Gene 
), dem GUS-Gen (Glukuronidasegen) und dem SEAP-Gen (Sezernierte-Alkalische-Phosphatase-Gen) ist. 

13. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 1 1 , dadurch gekennzeichnet, 

daB deren Replikation die Expression eines (zellularen) Surrogatmarkergens beeinfluBt. 

14. HCV-RNA-Konstrukt nach einem der Anspruche 1 1 bis 13, dadurch gekennzeichnet, 

daB das Resistenzgen derart in das offene Leseraster der HCV-RNA einWoniert ist, daB es erst nach einer pro- 
teolytischen Prozessierung in eine aktive Form uberfuhrbar ist. 

15. HCV-RNA-Konstrukt nach einem der Anspruche 1 1 bis 14, dadurch gekennzeichnet, 

daB das Reportergen und das selektierbare Markergen derart raumlich in dem Konstrukt angeordnet sind, daB 
sie gemeinsam ein Fusionsprotein exprimieren. 

16. Zellkultursystem nach einem der Anspruche 1 bis 3 dadurch gekennzeichnet, 

daB das HCV-RNA-Konstrukt ein Konstrukt gemaB wenigstens einem der Anspruche 4 bis 15 ist. 

17. Zellkultursystem nach Anspruch 1 , dadurch gekennzeichnet, 

daB die das HCV-RNA-Konstrukt enthaltenden Zellen bei der DSMZ, Braunschweig, BRD, unterder Hinterle- 
gungsnummer DSM ACC2394 (Laborbezeichnung HuBI 9-13) hinterlegt sind. 

18. Verwendung eines Zellkultursystems nach einem der Anspruche 1 bis 3 Oder 16 bis 17 und/oder eines HCV-RNA- 
Konstrukts nach einem der Anspruche 4 bis 15 zur Herstellung und/oder Evaluierung und/oder Testung von The- 
rapeutika und/oder Diagnostika zur Behandlung von insbesondere HCV-lnfektionen. 

19. Verwendung eines Zellkultursystems nach einem der Anspruche 1 bis 3 Oder 16 bis 1 7 und/oder eines HCV-RNA- 
Konstrukts nach einem der Anspruche 4 bis 15 zur Herstellung eines Impfstoffes gegen HCV-lnfektionen. 

20. Verwendung eines HCV-RNA-Konstrukts nach einem der Anspruche 4 bis 15 zur Herstellung einer leberzellspezi- 
f ischen Genfahre fur die Gentherapie . 

21. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 15, dadurch gekennzeichnet, 

daB es ein integriertes Fremdgen aufweist und dazu geeignet ist, dieses Fremdgen in eine Zielzelle einzu- 
schleusen, die zur Expression dieses Fremdgens geeignet ist. 

22. Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten eines HCV-RNA-Konstrukts gemaB einem der 
Anspruche 4 bis 15, wobei die Mutanten gegenuber dem HCV-RNA-Konstrukt eine erhohte Replikationseffizienz 
aufweisen, dadurch gekennzeichnet, 

daB man ein Zellkultursystem gemaB Anspruch 1 , bei dem das eingeschleuste HCV-spezifische Genmaterial 
ein HCV-RNA-Konstrukt mit Selektionsgen nach einem der Anspruche 4 bis 15 ist, auf/in dem dem Selektions- 
gen entsprechenden Selektionsmedium kultiviert, daB man die gewachsenen Zellklone erntet, und daB man 
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aus diesen Zellklonen die HCV-RNA-Konstrukte Oder Teile davon isoliert. 

23. Verfahren nach Anspruch 22, dadurch gekennzeichnet, 

5 daB man die isolierten HCV-RNA-Konstrukte wenigstens einmal erneut passagiert, namlich in Zellen eines 

Zellkultursystems nach Anspruch 1 einschleust, das dabei erhaltene Zellkultursystem gemaB Anspruch 1 , bei 
dem das eingeschleuste HCV-spezifische Genmaterial das isolierte HCV-RNA-Konstrukt mit Selektionsgen 
ist, auf/in dem dem Selektionsgen entsprechenden Selektionsmedium kultiviert, die gewachsenen Zellklone 
erntet und aus diesen Zellklonen die HCV-RNA-Konstrukte isoliert. 

10 

24. Verfahren zur Herstellung von Mutanten eines HCV-Vollangengenoms oder eines HCV-Teilgenoms oder eines 
beliebigen HCV- Konstrukts mit im Vergleich zu dem ursprunglichen HCV-Vollangengenom oder -Teilgenom oder 
HCV-RNA-Konstrukt erhohter Replikationseffizienz, dadurch gekennzeichnet, 

is daB man mit einem Verfahren nach Anspruch 22 oder 23 eine zellkultur-adaptierte Mutante eines HCV-RNA- 

Konstrukts herstellt und isoliert, 

daB man die Nukleotid- und Aminosauresequenz dieser Mutante bestimmt und durch Vergleich mit der 
Nukleotid- und Aminosauresequenz des ursprunglichen HCV-RNA-Konstrukts die Art, Anzahl und Positionen 
der Nukleotid- und Aminosauremutationen bestimmt, 
20 und daB man diese Mutationen entweder durch gezielte Mutagenese Oder durch Austausch von Sequenzab- 

schnitten, die die betreffenden Mutationen enthalten, in ein (isoliertes) HCV- Vollangengenom oder ein HCV- 
Teilgenom oder ein beliebiges HCV-RNA-Konstrukt einfuhrt. 

25. Zellkultur-adaptiertes HCV-RNA-Konstrukt mit hoher Replikationseffizienz, dadurch gekennzeichnet, 

25 

daB es durch Nukleotid- und/oder Aminosaure -Mutationen von einem HCV-RNA-Konstrukt nach einem der 
Anspruche 4 bis 15 ableitbar ist und daB es mit einem Verfahren nach einem der Anspruche 22 bis 24 erhaltlich 
ist. 

30 26. Zellkultur-adaptiertes HCV-RNA-Konstrukt nach Anspruch 25, dadurch gekennzeichnet, 

daB es einen oder mehrere der nachfolgend aufgefuhrten Aminosaureaustausche aufweist, namlich 1283 arg 
-> gly und/oder 1383 glu -> ala und/oder 1577 lys -> arg und/oder 1609 lys -> glu und/oder 1936 pro -> ser 
und/oder 2163 glu -> gly und/oder 2330 lys -> glu und/oder 2442 ile -> val aufweist. 

35 

27. Zellkultur-adaptiertes HCV-RNA-Konstrukt nach Anspruch 25 oder 26, dadurch gekennzeichnet, 

daB es einen oder mehrere der in Tabelle 3 aufgefuhrten Nukleotid- und/oder Aminosaureaustausche auf- 
weist, wobei Tabelle 3 Bestandteil dieses Anspruchs ist. 

40 

28. Zellkultur-adaptierte Mutanten eines HCV-RNA-Konstrukts oder eines HCV-Vollangengenoms mit im Vergleich zu 
dem ursprunglichen HCV-RNA-Konstrukt oder dem ursprunglichen HCV-Vollangengenom erhohter Replikationsef- 
fizienz , dadurch gekennzeichnet, 

45 daB sie mit einem Verfahren erhaltlich ist, bei dem man in einem zellkultur-adaptierten HCV-RNA-Konstrukt 

nach Anspruch 24 durch Sequenzanalyse und Sequenzvergleich die Art und Anzahl der Mutationen bestimmt 
und diese Mutationen in ein HCV-RNA-Konstrukt, insbesondere in ein HCV-RNA-Konstrukt gemaB einem der 
Anspruche 4 bis 15, oder in ein (isoliertes) HCV-RNA- Vollangengenom einfuhrt, entweder durch gezielte Muta- 
genese oder durch Austausch von Sequenzabschnitten, die die betreffenden Mutationen enthalten. 

50 

29. Hepatitis C Viruspartikel Oder virus-ahnliche Partikel dadurch gekennzeichnet, 

daB sie mit einem Verfahren nach einem der Anspruche 22-24 erhaltlich sind. 
55 30. Zellen, infiziert mit Hepatitis C Viruspartikel n oder virus-ahnliche Partikeln gemaB Anspruch 29. 
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